N3: "Introducción a la Minería de textos: Principios y Aplicaciones"

Turno Noche (19 a 22 horas)

John Anthony Atkinson: Universidad de Concepción, Chile

Descargar CV


Objetivos del Curso:

Este curso proporciona a los estudiantes una visión teórica y práctica acerca de los fundamentos, técnicas y problemas en el análisis, y descubrimiento de patrones desde información no estructurada (lenguaje natural), técnicas conocidas como Minería de Texto (Text Mining) con aplicaciones al análisis de inteligencia, vigilancia tecnológica, descubrimiento científico, etc.

Se revisarán las técnicas y enfoques modernos en el diseño y construcción de sistemas de minería de texto junto con sus fundamentos teóricos, y se abordarán técnicas efectivas recientes basadas en computación evolutiva para descubrir patrones desde grandes bases de datos textuales. Se estudiará la aplicación e integración de diferentes enfoques de minería de texto incluyendo las técnicas para el procesamiento del lenguaje natural, extracción de información, algoritmos genéticos y análisis semántico latente (LSA).


Programa:

  • El Problema de Text Mining y Knowledge Discovery from Texts.
  • Introducción y conceptos fundamentales: Data Mining, Web Mining y Text Mining, el problema con el análisis de texto y extracción de conocimiento.
  • Revisión de Técnicas de Data Mining y Aprendizaje Automático.
  • Principios del Tratamiento Automático de Lenguaje Natural para aplicaciones de Text Mining: Etiquetadores, Parsing Parcial, Extracción de Información, categorización, etc.
  • Recursos para Minería de Textos: Taggers, Ontologías, Herramientas de preprocesamiento, etc.
  • Representación de Conocimiento desde información textual: conceptos, estrategias y problemas.
  • Métodos evolutivos (basados en algoritmos genéticos) para minado de texto: naturaleza, representación, operadores, evaluación.
  • Técnicas y Enfoques Actuales para Text Mining: enfoques terminológicos, enfoques con uso de estructura lingüística de alto nivel, enfoques exploratorios, enfoques de máxima entropía, etc.
  • Evaluación automática de Patrones descubiertos: técnicas y desafíos.
  • Aplicaciones y Herramientas para Text Mining.
  • Discusión y Problemas abiertos.

Pre-requisito:

Son deseables, pero no imprescindibles conocimientos básicos de Teoría de Automatas (Lenguajes Formales), conceptos de Recuperación de Informacion, y algunas técnicas de IA. El material está preparado para una audiencia sin conocimientos previos