Computational learning for sensor signal analysis
- Ukil, Arijit
- Leandro Marín Muñoz Director
- Antonio Jesús Jara Valera Director/a
Universidad de defensa: Universidad de Murcia
Fecha de defensa: 10 de mayo de 2023
- Jaime Martín Serrano Orozco Presidente/a
- Gema María Díaz Toca Secretaria
- Vicente Jara Vera Vocal
Tipo: Tesis
Resumen
Objetivo: el objetivo general es construir modelos precisos de aprendizaje automático para resolver desafíos prácticos como la escasez de datos de entrenamiento, la construcción de modelos compactos y la preservación de la privacidad de los datos para un conjunto diverso de tareas de análisis de señales de sensores. Con la proliferación de Internet de las cosas (IoT), los avances de las tecnologías de detección, las increíbles mejoras hacia el poder de cómputo junto con el progreso sobresaliente de los algoritmos y herramientas de inteligencia artificial, los investigadores están encontrando nuevas vías para crear diferentes aplicaciones útiles y direcciones de investigación novedosas. El trabajo de investigación se centra en la construcción de modelos para el aprendizaje computacional de tareas de análisis que involucran diferentes tipos de señales de sensores de sensores como electrocardiograma, fonocardiograma, acelerómetro, medidor de energía, etc. Muchos sensores pueden considerarse como la micro-representación de la fisiología humana y la actividad humana y tales sensores contienen información sensible. Por lo tanto, nuestra tarea principal es la habilitación de técnicas de preservación de la privacidad como parte de los modelos de detección computacional que analizan las señales de los sensores e infieren decisiones críticas. Metodología : se entiende que la atención médica remota es una de las aplicaciones críticas de IoT y resolvemos el problema de la protección de la privacidad de los datos al proponer la eliminación del riesgo de la gestión de datos confidenciales mediante la privacidad diferencial, donde la protección de privacidad controlada habilitada por el usuario en datos de atención médica confidenciales puede ser empleado. El método de protección de la privacidad propuesto ofusca los datos confidenciales para garantizar que se realice una protección adecuada mientras que la utilidad no se ve gravemente comprometida, y el control de la habilitación de la privacidad está dirigido por el usuario. La limitación de este trabajo es que el algoritmo de aprendizaje automático que realiza la tarea de análisis requiere una ingeniería de funciones artesanal, que no solo restringe la escalabilidad del aprendizaje computacional, sino que también depende del costoso proceso de generación de funciones asistida por expertos o conocimiento del dominio. y selección. Desarrollamos detección integrada de inteligencia que realiza tareas de clasificación supervisadas utilizando un método novedoso de aprendizaje profundo (DL) de red neuronal convolucional ajustada por hiperparámetros sin esfuerzos de ingeniería de requisitos. Ampliamos nuestra investigación para abordar el problema integral de la escasez de datos de entrenamiento en la generación de modelos DL. Se sabe que los modelos DL exigen ejemplos de entrenamiento sustanciales para la construcción confiable del modelo computacional. Las tareas prácticas de análisis de señales de sensores a menudo se proporcionan con un número limitado de ejemplos de capacitación, principalmente debido a los costos asociados con la anotación de expertos. Proponemos un método novedoso de aprendizaje efectivo bajo la limitación de datos de entrenamiento utilizando el descubrimiento atribuido por Shapley de un subconjunto de entradas que influyen positivamente para construir un modelo DL efectivo basado en redes residuales. Resultados : nuestro novedoso método de preservación de la privacidad propone el principio de incertidumbre de los datos del sensor, de modo que se emplea la incertidumbre estadística controlada para la información confidencial usando como definición de protección de la privacidad que las probabilidades a priori y a posteriori de encontrar información privada no cambian más allá de un umbral predefinido y la ganancia del adversario en el acceso a datos confidenciales se vuelva insignificante. La estimación de hiperparámetros propuesta a partir de las características de la señal de entrada facilita la construcción del modelo CNN compacto y demostramos que el modelo propuesto supera constantemente los algoritmos de última generación relevantes para la tarea de aprendizaje computacional dada de detección de condiciones de fibrilación auricular a partir de registros de ECG de una sola derivación. Con la novedosa arquitectura push-pull DL propuesta, donde la selección del subconjunto de entrada a través de la atribución del valor de Shapley empuja el modelo a una dimensión más baja mientras que el entrenamiento adversario aumenta la capacidad de aprendizaje del modelo sobre datos no vistos, demostramos un rendimiento superior a algoritmos actuales de última generación para tareas de clasificación sobre diversos conjuntos de señales de sensores de series temporales. Conclusión : hemos propuesto un marco holístico para resolver los desafíos prácticos y de investigación del análisis computacional de las señales de los sensores, incluida la preservación de la privacidad de los datos, el algoritmo de aprendizaje profundo para la generación de modelos compactos, el modelo computacional efectivo bajo el problema de la escasez de datos de entrenamiento. En resumen, el trabajo de investigación proporciona un enfoque unificado para desarrollar un análisis computacional práctico para diversos conjuntos de datos de sensores.