Sintetizador paramétrico multidispositivo de lengua de signos española

López Colino, Fernando Jesús

Sintetizador paramétrico multidispositivo de lengua de signos española

López Colino, Fernando Jesús

Dirigida por:

José Colás Pasamontes Director/a

Universidad de defensa: Universidad Autónoma de Madrid

Fecha de defensa: 15 de octubre de 2009

Tribunal:

Javier Garrido Salas Presidente/a
Doroteo Torre Toledano Secretario/a
Alonso Alonso Alonso Vocal
Juan Manuel Montero Martínez Vocal
Javier Macías Guarasa Vocal
Rubén San Segundo Hernández Vocal
Sira Elena Palazuelos Cagigas Vocal

Tipo: Tesis

Teseo: 295400 DIALNET Biblos-e Archivo editor

Resumen

La síntesis de lengua de signos es un área de investigación con una antigüedad de apenas una década, periodo en el cual han surgido numerosas aproximaciones a este tema. La técnica más utilizada es la síntesis paramétrica, donde se parte de una descripción de los signos en función de los siete parámetros formativos quinésicos (PFQ). que los conforman. Aunque esta técnica no produce los resultados más naturales, si es la única que ofrece la flexibilidad y grado de control necesarios para gestionar la complejidad de la lengua de signos, razón por la que ha sido elegida para esta tesis. Los sintetizadores paramétricos actuales utilizan una adaptación a XML de las notaciones iconográficas que describen los PFQ de los signos a sintetizar. Esta aproximación es equivalente a la síntesis de voz, en la que se utiliza una notación gráfica para representar los fonemas. El uso de esta aproximación presenta ciertos inconvenientes, tales como que la descripción de un mensaje a sintetizar es una tarea compleja o la falta de definición en la dimensión temporal de los signos: cada uno de los PFQ se definen como una secuencia de unidades en las que es necesario definir el instante en que se representan cada una de ellas; de igual modo, la síntesis de lengua de signos requiere de la definición de puntos de sincronización entre dichas secuencias En este traba jo afrontamos la síntesis parametrización de la lengua de signos desde una nueva perspectiva. Para obtener mayor precisión en la definición de los signos hemos optado por el uso de una base de datos relacional para su almacenamiento. Esta base de datos no sólo permite disponer de descripciones más precisas, detalladas y extensiibles, sino que además permite definir representaciones paralelas, tanto de los propios signos como de los PFQ, gracias a los cuales se pueden contemplar en la misma base de datos la representación de los signos en distintos idiomas o dialectos y afrontar la síntesis de variantes emocionales para los signos. Una mayor fexibilidad de las descripciones de los signos, permite que los expertos en este modo de comunicación, especialmente signantes nativos, participen tanto en la evaluación como en la propia definición de los signos. Para ello se ha diseñado un conjunto de aplicaciones específicas para esta tarea. Dado que la notación de entrada ya no debe describir los signos mediante los PFQ, podemos definir una notación de entrada en un nivel superior de abstracción, lo que facilita la descripción de mensajes en lengua de signos. Esta nueva notación, que hemos denominado HLSML, contempla las tres unidades semánticas de la lengua de signos: diccionario dactilológico, signos establecidos y construcciones clasificatorias. Junto con las novedades anteriores, este sintetizador presenta, además, dos características que lo diferencian de otras aproximaciones a la lengua de signos. La primera se refiere a la arquitectura del sintetizador: la mayoría de los sintetizadores actuales se han planteado como aplicaciones de PC presentando determinados requisitos gráficos y computacionales que difícilmente pueden ser soportados por un dispositivo móvil; este trabajo aporta una arquitectura modular que permite distribuir el proceso de síntesis entre un servidor dedicado y el dispositivo del cliente, adaptándose a los re cursos de éste. La segunda afecta al diseño del avatar: los avatares utilizados en otros sintetizadores utilizan una estructura esquelética estándar que únicamente contempla la animación del propio avatar; el diseño propuesto incluye un conjunto de huesos especiales que facilitan tanto la animación del avatar como la descripción de los signos, eliminando la dependencia de la definición de la malla del avatar.