Nuevos algoritmos basados en núcleos para minería de datos

  1. PARRADO HERNANDEZ, EMILIO
Zuzendaria:
  1. Angel Navia Vázquez Zuzendaria

Defentsa unibertsitatea: Universidad Carlos III de Madrid

Fecha de defensa: 2003(e)ko urria-(a)k 14

Epaimahaia:
  1. Aníbal Ramón Figueiras Vidal Presidentea
  2. Fernando Pérez Cruz Idazkaria
  3. Daniel Borrajo Millán Kidea
  4. Ioannis Dimitriadis Damoulis Kidea
  5. P. Bennet Kristin Kidea

Mota: Tesia

Teseo: 99165 DIALNET

Laburpena

Esta tesis doctoral pretende aumentar la utilidad de los métodos de aprendizaje automático basados en núcleos dentro de la minería de datos. En concreto, se aporta una colección de algoritmos que mejoran la escalabilidad de dichos métodos, posibilitan un análisis multirresolución de los datos y facilitan la interpretabilidad del resultado del aprendizaje. Estos algoritmos se aplican en problemas de clasificación y de agrupamiento de patrones. Con respecto a la escalabilidad de los algoritmos, los experimentos muestran reducciones del tamaño de máquina de hasta dos órdenes de magnitud con respecto a los métodos de núcleos encontrados en la literatura, conservando las excelentes prestaciones de capacidad de generalización de estos últimos. El análisis multirresolución se consigue mediante la combinación en la misma máquina de nodos con diferentes tipos de función núcleo, dedicándose cada tipo al análisis a una diferente granularidad. La interpretabilidad del aprendizaje se facilita mediante una nueva familia de algoritmos basados en proyecciones interpretables al espacio de características. Algunos de los algoritmos desarrollados se han probado con éxito en tareas de minería de datos tales como la clasificación de documentos, la autoorganización de colecciones de textos y la detección de puntos críticos en señales de electrocardiogramas.