Nuevos algoritmos basados en núcleos para minería de datos

  1. PARRADO HERNANDEZ, EMILIO
Dirigida por:
  1. Angel Navia Vázquez Director/a

Universidad de defensa: Universidad Carlos III de Madrid

Fecha de defensa: 14 de octubre de 2003

Tribunal:
  1. Aníbal Ramón Figueiras Vidal Presidente/a
  2. Fernando Pérez Cruz Secretario/a
  3. Daniel Borrajo Millán Vocal
  4. Ioannis Dimitriadis Damoulis Vocal
  5. P. Bennet Kristin Vocal

Tipo: Tesis

Teseo: 99165 DIALNET

Resumen

Esta tesis doctoral pretende aumentar la utilidad de los métodos de aprendizaje automático basados en núcleos dentro de la minería de datos. En concreto, se aporta una colección de algoritmos que mejoran la escalabilidad de dichos métodos, posibilitan un análisis multirresolución de los datos y facilitan la interpretabilidad del resultado del aprendizaje. Estos algoritmos se aplican en problemas de clasificación y de agrupamiento de patrones. Con respecto a la escalabilidad de los algoritmos, los experimentos muestran reducciones del tamaño de máquina de hasta dos órdenes de magnitud con respecto a los métodos de núcleos encontrados en la literatura, conservando las excelentes prestaciones de capacidad de generalización de estos últimos. El análisis multirresolución se consigue mediante la combinación en la misma máquina de nodos con diferentes tipos de función núcleo, dedicándose cada tipo al análisis a una diferente granularidad. La interpretabilidad del aprendizaje se facilita mediante una nueva familia de algoritmos basados en proyecciones interpretables al espacio de características. Algunos de los algoritmos desarrollados se han probado con éxito en tareas de minería de datos tales como la clasificación de documentos, la autoorganización de colecciones de textos y la detección de puntos críticos en señales de electrocardiogramas.