Integrolysistema automático de población de un grafo de conocimiento a partir de datos sociales masivos en el dominio de marketing político
- Guedea Noriega, Héctor Hiram
- Francisco García Sánchez Director
Universidad de defensa: Universidad de Murcia
Fecha de defensa: 13 de junio de 2022
- Rafael Valencia García Presidente
- Miguel Ángel Rodríguez García Secretario/a
- Juan Miguel Gómez-Berbís Vocal
Tipo: Tesis
Resumen
Las campañas políticas modernas se sustentan en estrategias formuladas en base a lo que se ha dado en conocer como marketing político. El marketing político abarca desde la definición del producto político, a través de un minucioso análisis de las necesidades del electorado, hasta el desarrollo de campañas y la gestión de la comunicación política. La inteligencia de mercado, esto es, entender las demandas reales del mercado político, supondrá la primera etapa en este complejo proceso. Uno de los principales problemas de la inteligencia de mercado político es el procesamiento de la diversidad de las fuentes de datos como son las encuestas, redes sociales, páginas Web, entre otras más. Las redes sociales se han convertido en una de las principales plataformas de conversación y canales para compartir experiencias y opiniones. Sin embargo, el monitoreo, la extracción, el procesamiento, el almacenamiento y el análisis de los datos masivos sociales en el ámbito político es una tarea complicada por su heterogeneidad propia de la estructura de la fuente de datos. A pesar de los retos, estas tareas son muy importantes para lograr encontrar las demandas de los potenciales votantes, y con ello, crear una estrategia y toma de decisiones ligada a las mismas. Las tecnologías de la Web semántica, y en particular, las ontologías, permiten generar una base de conocimiento homogéneo, compartido y reutilizado, con un formato legible por la máquina y enriquecido para apoyar el descubrimiento, la integración, la representación y la gestión del conocimiento. En los últimos años, las ontologías y los grafos de conocimiento (KG) han demostrado ser eficaces para propiciar una solución de integración de datos y ayudando con la complejidad de encontrar relaciones significativas dentro de los datos heterogéneos. Este trabajo se enfoca en dos principales contribuciones, la primera, generar un modelo ontológico basado en el dominio de marketing político, y la segunda, en una propuesta de sistema para la población automática de un grafo de conocimiento a partir de datos masivos sociales en el dominio del marketing político. Nuestra propuesta de modelo ontológico se realizó basado en los criterios y necesidades del marketing político. La construcción de la ontología fue a través de metodología estándar Ontology 101, donde se definió el dominio y alcance, se consideró la reutilización de ontologías existentes, se enumeraron los términos importantes para la ontología, hasta la definición de clases, propiedades, relaciones e instancias base. La ontología se bautizó como PMont (Political Marketing Ontology) la cual responde preguntas clave del marketing político. La PMont permitió la integración de la información disponible sobre el electorado y candidatos a través de distintas fuentes de datos. La segunda aportación de este trabajo de investigación es una solución automatizada basada en textos en castellano a través de técnicas de Machine Learning y Procesamiento del Lenguaje Natural, recolección datos significativos de fuentes de medios digitales semiestructurados y no estructurados, procesamiento datos masivos y finalmente la población de un grafo de conocimiento previamente definido por un modelo ontológico del dominio de marketing político. La propuesta de sistema de automatización cuenta con las siguientes fases o componentes: (i) conectividad a fuentes y almacenamiento de datos, (ii) procedimiento de extracción de información, (iii) proceso de población y validación de la ontología, y finalmente, (iv) el grafo de conocimiento resultante. Como resultado de esta tesis doctoral se tiene un grafo de conocimiento poblado con información validada, precisa, consistente y confiable. El grafo de conocimiento fue evaluado a través de 18 requisitos de calidad sobre las dimensiones de accesibilidad, contextualidad, intrínseca y representatividad, de los cuales nos brinda una base de conocimiento óptima para la inteligencia de mercado del marketing político.