Técnicas de compresión e estruturas de indexación compactas para texto en linguaxe natural e contidos dixitaisaplicacións prácticas

  1. Rodríguez López, Eduardo
Dirigida por:
  1. Ángeles Saavedra Places Director/a
  2. Antonio Fariña Director/a

Universidad de defensa: Universidade da Coruña

Fecha de defensa: 21 de diciembre de 2015

Tribunal:
  1. Nieves R. Brisaboa Presidente/a
  2. Miguel Á. Martínez Prieto Secretario
  3. Raquel Trillo Lado Vocal

Tipo: Tesis

Teseo: 397873 DIALNET lock_openRUC editor

Resumen

La aplicación de los resultados de la investigación al desarrollo software permite crear sistemas innovadores que resuelven problemas, organizan procesos o que ofrecen servicios a la sociedad de una forma más eficaz y eficiente. En la primera parte de esta tesis se presentan dos nuevas técnicas del área de investigación en compresión e indexación de texto en lenguaje natural. Por una parte, un autoíndice que permite obtener una representación comprimida del texto utilizando tan solo un 35-40% de su tamaño original, a la vez que realizar búsquedas muy eficientes dentro de él. Por otra parte, un compresor orientado a frases que permite reducir un texto hasta ocupar un 25-30% de su tamaño original, ofreciendo una descompresión muy rápida y la posibilidad de realizar búsquedas eficientes en el texto comprimido. En la segunda parte se presentan distintas soluciones tecnológicas que hemos desarrollado e integrado en sistemas reales en producción para resolver diferentes aspectos relacionados con el consumo de contenidos digitales, como su creación y distribución protegida, y cómo estas hacen uso de diferentes resultados de la investigación en compresión e indexación para mejorar la eficiencia en el almacenamiento, acceso, procesado y transmisión de los contenidos de naturaleza textual.