RT bachelor thesis T1 Diseño de estación acústica inteligente (ESAI) A1 Pecci Sánchez, Daniel A2 Ingeniería en AutomáticaElectrónica, Arquitectura y Redes de Computadores K1 PCB K1 Internet of Things K1 Embedded design K1 ESP32 K1 Hardware design K1 Electronic design K1 C++ K1 C language K1 Python K1 BackEnd K1 FrontEnd K1 MQTT K1 HTTP K1 SSL K1 Electronic Automation K1 Electronic Engineering AB El objetivo será lograr diseñar e implementar un sistema de detección acústica autónomo que estará formado por un conjunto de nodos inteligentes interconectados con un servidor central que adquiere, almacena y procesa los datos transmitidos por estos nodos. Este procesamiento se llevará en última instancia por un modelo de Red Neuronal Convolucional (CNN) entrenado en la identificación y clasificación de sonido. Los nodos, denominados de ahora en adelante como estaciones o ESAIs, aprovecharán al máximo la capacidad de cómputo de bajo consumo y coste reducido de un microcontrolador. El sistema potencialmente puede ser capaz de detectar más de 500 tipos de sonidos, desde roturas de cristales, encendido de motores, sonido de maquinaría hasta decenas de sonidos asociados a los humanos y animales pasando por la clasificación de géneros musicales. Para la muestra del proyecto se ha limitado al alcance a la detección de 4 eventos. Los eventos a detectar incluyen la rotura de cristales (para reconocer intrusiones), el llanto de bebé (como monitor de bebé), la detección de pájaros y, finalmente, la detección de presencia humana (respiración, tos, habla, pisadas, silbido, etc.). Las estaciones serán capaces de operar como SoftAPs capaces de generar servidores y portales captivos locales y también como estaciones que se comunican mediante un protocolo ligero (MQTT) al servidor a través de un broker Mosquitto. Por otro lado el Servidor DJANGO se encargará de recibir, almacenar y procesar los paquetes de audio de la estación (mediante la CNN) y enviar el resultado de la inferencia a las mismas. También ofrecerá una experiencia al usuario para poder escuchar el sonido captado en tiempo real a la vez que visualiza los resultados de la inferencia. También se creará otra página web para poder configurar de nuevo los modos de operación de la estación, buscar actualizaciones o solicitar cambiar el punto de acceso al que la estación se va a conectar.Las estaciones contarán con funcionalidad OTA para poder actualizar o corregir su firmware de forma remota en cualquier momento.Las comunicaciones entre estaciones, broker y servidor se realizan con seguridad en la capa de transporte (SSL/TLS). YR 2024 FD 2024-04-10 LK http://hdl.handle.net/10498/31708 UL http://hdl.handle.net/10498/31708 LA spa NO -Flexibilidad: La función o modo de operación de una estación puede transformarse en otra en cualquier instante.-Personalización: Otro objetivo de este proyecto es la de ofrecer una experiencia óptima al usuario. Aunque los nodos operen de forma autónoma, se ofrecerá la posibilidad de escuchar de forma remota y en tiempo real el sonido capturado por la estación, así como visualizar la clasificación del sonido realizado por la red neuronal. Por otro lado, el usuario podrá configurar el modo de operación, los eventos a detectar o incluso actualizar el firmware remotamente de cualquier estación.-Escalabilidad: El sistema estará preparado para la adición o combinación de nuevos módulos que se integren fácilmente sin necesidad de rediseñar o cambiar lo existente. La estación podrá operar de dos formas principales:- Modo escucha: Captará el sonido de su entorno a través del micrófono integrado y trasmitirá los paquetes de audio al servidor. Recibirá y procesará la predicción del modelo para detectar eventos. Si el modo silencio no está activado, activará una salida que puede ser por ejemplo un led indicador, un zumbador o un driver para controlar una alarma acústica de alto nivel sonoro.- Modo chivato: No captará el sonido ambiente. Se limitará a recibir y procesar la inferencia para la detección de eventos del sonido captado por otra ESAI. Este modo surge como forma de avisar de forma instantánea y efectiva al usuario que un evento ha ocurrido, aunque se encuentre a miles de kilómetros del lugar donde está la estación escucha, siempre y cuando tenga conexión a un punto de acceso conectado a su vez a internet. De esta manera, solventamos de forma elegante el hecho de que el módulo ESP32 usado no tenga capacidad GSM o LTE poder enviar mensajes “sms” o hacer llamadas a un número de teléfono. También se podría implementar esta funcionalidad en el servidor, pero en cualquier caso aumenta complejidad y supone implicar el servicio de terceras partes lo cual incrementa el coste también. DS Repositorio Institucional de la Universidad de Cádiz RD 10-may-2026