Clasificación fonética independiente del locutor usando una jerarquía de RNAs especializadas
ISSN: 1135-5948
Datum der Publikation: 1999
Nummer: 25
Seiten: 191-198
Art: Artikel
Andere Publikationen in: Procesamiento del lenguaje natural
Zusammenfassung
Se describe una técnica para la clasificación fonética independiente del locutor mediante el uso de Redes Neuronales Artificiales (RNAs) especializadas; la técnica propuesta se basa en el principio "dividir para vencer" al utilizar una jerarquía de RNAs que se encarga de realizar la tarea por etapas. La jerarquía implementada consiste en un conjunto de Perceptrones Multicapa (PMCs), con un "clasificador modal" que se encarga de clasificar los patrones de entrada de acuerdo a su modo de articulación. Una vez preclasificado, el patrón de entrada es redirigido a un segundo PMC que ha sido entrenado para clasificar los fonemas que componen una categoría modal particular. Se presentan resultado obtenidos al clasificar datos de 108 locutores del corpus en castellano de OGI, el cual contiene habla continua grabada por línea telefónica. Los resultados expuestos abarcan cuatro parametrizaciones utilizadas comúnmente en el preproceso de señales de voz: CPL(LPC), Cepstrum, PLP y Mel Cepstrum.