Percepción dinámica del entorno en un robot móvil

BACHILLER BURGOS, PILAR

Percepción dinámica del entorno en un robot móvil

BACHILLER BURGOS, PILAR

Zuzendaria:

Pablo Bustos García de Castro Zuzendaria

Defentsa unibertsitatea: Universidad de Extremadura

Fecha de defensa: 2008(e)ko uztaila-(a)k 10

Epaimahaia:

Félix Monasterio-Huelin Maciá Presidentea
José María Cañas Plaza Idazkaria
Antonio Bandera Kidea
Alberto Ruiz García Kidea
José Moreno del Pozo Kidea

Mota: Tesia

Teseo: 178341 DIALNET

Laburpena

RESUMEN: Durante los últimos años, la atención se ha convertido en una cuestión de gran interés en visión artificial. Los estudios sobre los mecanismos atencionales en la visión biológica han inspirado numerosos modelos computacionales. La mayoría de ellos se basan en la hipótesis de capacidad limitada asociada con la función de la atención desde algunas propuestas psicológicas. Estas teorías suponen que el sistema visual tiene una capacidad de procesamiento limitada y que la atención actúa como un filtro que selecciona qué información debe ser procesada en cada instante. Dicha suposición ha sido criticada por muchos autores que afirman, a partir de diversos estudios, que la capacidad de procesamiento de los sistemas perceptivos en los humanos es enorme. Desde este punto de vista, la función de un subsistema que seleccione qué información debe ser procesada no es necesaria. En su lugar, justifican el papel de la atención desde la perspectiva de la selección para la acción. De acuerdo con esta nueva concepción, la función de la atención es evitar la desorganización conductual mediante la selección de la información apropiada para la ejecución de una tarea. Esta noción de la atención resulta de gran interés en el campo de la robótica, donde se persigue, como objetivo fundamental, la construcción de robots autónomos que interactúen con entornos complejos, manteniendo múltiples objetivos conductuales. La selección atencional para la acción permitiría guiar los comportamientos del robot centrándose en objetivos visuales de interés y evitando las posibles distracciones. Dando un paso más, podríamos concebir esta forma de atención como un mecanismo de coordinación, dado que permitiría serializar las acciones de los posiblemente múltiples comportamientos activos. Para explotar estas ideas, en esta tesis se propone un sistema de atención visual basado en la teoría de la selección para la acción. El sistema ha sido diseñado y probado en un robot móvil dotado de una torreta de visión estéreo. El sistema propuesto es modelado como un grupo de componentes de procesamiento específico que colaboran para seleccionar, fijar y mantener objetivos visuales de acuerdo con diferentes necesidades de actuación. Los componentes de bajo nivel están relacionados con la adquisición de imágenes y el control motor, así como con la detección y el mantenimiento de regiones de interés del entorno. Los componentes del nivel intermedio se encargan de extraer grupos de características de cada región de interés relacionadas con diversas cuestiones sobre el #qué# (información de aspecto) y el #cómo# (información espacial). Estas características son utilizadas por componentes de alto nivel, a los que denominamos selectores de objetivo, para dirigir la atención en función de ciertas especificaciones conductuales. El control atencional no está centralizado, sino que se encuentra distribuido entre varios selectores de objetivo. Cada uno de ellos dirige la atención a partir de diferentes especificaciones para centrarse en diferentes tipos de objetivos visuales. En un momento determinado, la atención abierta es dirigida por un único selector, mientras que los restantes atienden de manera encubierta a sus correspondientes objetivos. La frecuencia de adquisición del control abierto de la atención en cada selector es modulada por unidades de comportamiento de alto nivel de acuerdo con sus necesidades de información. Tras su selección, un objetivo es foveatizado a partir de dos movimientos independientes de las cámaras: un movimiento sacádico y de seguimiento en una de las cámaras y un movimiento asimétrico de vergencia en la otra. Esto permite mantener una fijación binocular estable, aunque el control atencional esté basado en información monocular. Una vez que este proceso senso-motor se completa, el objetivo que constituye el foco abierto de atención es enviado a las unidades de comportamiento. Sólo las acciones compatibles con el foco de atención son entonces ejecutadas, resolviendo el problema de coordinación entre comportamientos. El sistema completo actúa como una arquitectura de control que es atraída hacia diferentes objetivos visuales con finalidad ejecutiva. El intercalado específico entre las acciones viene dado por una relación de tiempos que emerge a partir de parámetros internos y características externas del mundo.