Nuevos algoritmos basados en núcleos para minería de datos

  1. PARRADO HERNANDEZ, EMILIO
Dirixida por:
  1. Angel Navia Vázquez Director

Universidade de defensa: Universidad Carlos III de Madrid

Fecha de defensa: 14 de outubro de 2003

Tribunal:
  1. Aníbal Ramón Figueiras Vidal Presidente/a
  2. Fernando Pérez Cruz Secretario/a
  3. Daniel Borrajo Millán Vogal
  4. Ioannis Dimitriadis Damoulis Vogal
  5. P. Bennet Kristin Vogal

Tipo: Tese

Teseo: 99165 DIALNET

Resumo

Esta tesis doctoral pretende aumentar la utilidad de los métodos de aprendizaje automático basados en núcleos dentro de la minería de datos. En concreto, se aporta una colección de algoritmos que mejoran la escalabilidad de dichos métodos, posibilitan un análisis multirresolución de los datos y facilitan la interpretabilidad del resultado del aprendizaje. Estos algoritmos se aplican en problemas de clasificación y de agrupamiento de patrones. Con respecto a la escalabilidad de los algoritmos, los experimentos muestran reducciones del tamaño de máquina de hasta dos órdenes de magnitud con respecto a los métodos de núcleos encontrados en la literatura, conservando las excelentes prestaciones de capacidad de generalización de estos últimos. El análisis multirresolución se consigue mediante la combinación en la misma máquina de nodos con diferentes tipos de función núcleo, dedicándose cada tipo al análisis a una diferente granularidad. La interpretabilidad del aprendizaje se facilita mediante una nueva familia de algoritmos basados en proyecciones interpretables al espacio de características. Algunos de los algoritmos desarrollados se han probado con éxito en tareas de minería de datos tales como la clasificación de documentos, la autoorganización de colecciones de textos y la detección de puntos críticos en señales de electrocardiogramas.