Asignaturas

Asignaturas Primer cuatrimestre 2012


Horarios, profesores y contenidos, correspondientes a las materias de la Maestria y Carrera de especialización en Data Mining y Knowledge Discovery. Para inscribirse en los cursos, en forma vocacional, consultar a: data_mining@dc.uba.ar.

Asignaturas de Primer Año - Primer Cuatrimestre de 2012
ASIGNATURA
TEMARIO

Aprendizaje Automático

Jueves de 19 a 22

 
Aprendizaje conceptual, espacio de versiones. Árboles de decisión. Sobreajuste y navaja de Occam. Redes neuronales. Estimación e intervalos de confianza. Aprendizaje bayesiano. Teoría computacional del aprendizaje. Aprendizaje PAC, dimensión VC, cotas de error. Aprendizaje basado en instancias. Algoritmos genéticos. Aprendizaje de conjuntos de reglas. Aprendizaje analítico. Aprendizaje por refuerzo. Combinación de clasificadores: mayoría ponderada, bagging, boosting. Enfoques multiestratégicos.
 

Data Mining

 

Viernes 19 a 22

 
Etapas del proceso de data-mining. Reglas de asociación. Mining de “canasta de mercado”. Algoritmo A-Priori, algoritmo PCY y extensiones. Mining de bajo soporte y alta correlación. Query flocks, estrategias de ejecución. Búsquedas en la Web y Web-mining. Clustering: medidas de distancia, dimensionalidad, distintos enfoques. Matching de secuencias. Modelo de episodios.
 

 

Análisis Inteligente

de Datos

 

Teóricas:

Sábados de 11 a 13

 

Prácticas en Laboratorio:

Grupo I:  Sábados de 09 a 11

Grupo II: Sábados de 14 a 16

 

Análisis exploratorio y confirmatorio. Reseña histórica. Revisión de métodos exploratorios; tablas, gráficos, diagramas de tallo y hoja, box-plot, análisis de normalidad. Técnicas descriptivas multidimensionales. Análisis en componentes principales. Análisis factorial de correspondencias. Métodos de clasificación y agrupamiento. Clasificación Jerárquica. K-medias. Caras de Chernov. Gráficos de estrellas. Gráficos de Rayos Sol. Gráficos de Andrews. Relación entre Análisis factorial y Clasificación. Árboles de decisión. Métodos de segmentación. Análisis
discriminante.
Asignaturas de Segundo Año - Primer Cuatrimestre de 2012

Data Mining en

Series de Tiempo

 

Jueves de 19 a 22

 

Análisis Estadístico de Series de Tiempo. Teoría Básica de los Procesos Estocásticos. Procesos Estocásticos Estacionarios. Modelos Autorregresivos –Promedios Móviles (ARMA). Modelos para Series No Estacionarias (ARIMA). Metodología de Box y Jenkins. Identificación. Estimación. Verificación. Pronóstico. Simulación de Procesos. Data Mining en Finanzas. Manejo del Software Amibrocker. Presentación y Uso de los Indicadores más comunes en el mercado. Visualización y manipulación de Índices Mundiales y otras Series Temporales de Interés. Construcción y aplicación de Estrategias sobre grandes volúmenes de datos.

 

Visualización
de la Información

 

Viernes de 19 a 22

 

*Visualización de Información, Introducción*: ¿Que es Visualización?. Antecedentes. Visualización de Información. Dato e Información, Tipos de Datos, ejemplos.
*Visualización de Información vs Visualización Científica*: Que busca cada disciplina. Diferencias y similitudes.
*Posibles Modelos*: El modelo estático (antes del uso de las computadoras). El modelo interactivo (herramientas de visualización interactivas)
*Interpretación de datos cuantitativos*: Contexto, dimensionalidad, datos univariados, datos bivariados, datos trivariados, datos multidimensionales, coordenadas paralelas.
*Representación:* Representación simbólica, tamaño, largo y alto, magnificación, caras de Chernoff, iconos multidimensionales, espacialidad, patrones, color, sonido, movimiento.
*Exploración Dinámica*: Problemas reales, Consultas a través de línea de comandos, consultas dinámicas, el explorador de atributos, VLDB, el explorador de vecindades.
*Modelos Internos, su formación y su interpretación*: La necesidad de un modelo, navegación, modelos internos, formación del modelo, interpretación del modelo, la formulación de una estrategia de navegación.
*Presentación*: El problema de la presentación, Foco y contexto, supresión, lentes mágicos, zoom y desplazamiento, acercamiento semántico.
*Conectividad*: Conexiones, Teoría de Grafos, Redes Generales, Árboles, Redes Bayesianas.
*Visualización de Documentos*: Visualizando lo no visual, Consultas, El sistema de barras apiladas, Mapas Temáticos, Galaxias, Galaxias de Noticias, Mapas de Kohonen.
*Sistemas de Información Geográficos*: Representación, Almacenamiento, Recuperación, Presentación, Interacción

*Bibliografía*:
Spence, R.. (2001) “*Information Visualization*”, Addison-Wesley 
Tufte, E. R. (1983) “*The Visual Display of Quantitative Information*”. Cheshire, CT: Graphic Press.
Tufte, E. R. (1990) “*Envisioning Information*”. Cheshire, CT: Graphics Press.
Tufte, E. R. (1997) *“Visual Explanations: Images and Quantities, Evidence and Narrative”*. Cheshire, CT: Graphic Press.
Tufte, E.R. (2006) “*Beautiful Evidence*”, Cheshire, CT: Graphic Press. Card S.K., Mackinlay J.D.
Shneiderman B. (1999*) “Readings in Information Visualization Using Vision to Think*” Morgan Kaufmann.Spence, R..
(2001) “*Information Visualization*”, Addison-Wesley
Wilkinson, L. (2005). *"The Grammar of Graphics"*, 2nd ed. New York: Springer-Verlag.
Ed H. Chi (2000). "*A Taxonomy of Visualization Techniques using the Data State Reference Model*"
Kohonen, T. (1990) “*The Self-Organizing Map*”. Proceedings of the IEEE,78(9), 1464-1480.
Borgelt C., Kruse R. (2001) “*Graphical Models, Methods for Data Analysis and Mining*”. Wiley.

 

*Software*:

Tableau's Data Vsualization Software: is provided through the Tableau for Teaching program.

 

 

Taller de Tesis I

 

Sábados de 09 a 17

 

Clases a dictar los días:

 

Sábados 05, y 19 de Mayo

Sábados 02, 16 y 30 de Junio

 


Temas teóricos (del programa):

 

1. Objetivos y conceptos básicos
2. Etapas en la preparación de documentos
3. Metodología
4. Hallazgos o Resultados
5. Tablas
6. Figuras
7. Introducción, marco teórico y objetivos
8. Discusión y conclusiones
9. Referencias bibliográficas
10. Título y palabras clave
11. Resumen y Agradecimientos
12. Corrección y apreciación del manuscrito
13. Autoría
14. Criterios de elección de las revistas. Indización
15. Preparación y envío del manuscrito
16. Evaluación del manuscrito
17. Otros documentos académicos o científicos
18. Tesis de Posgrado
19. Ética y fraude científico
20. Presentaciones orales y en posters

Actividades conexas:

 

A. Análisis de un artículo
B. Metodología
C. Resultados
D. Tablas
E. Figuras
F. Introducción
G. Discusión y conclusiones
H. Referencias
I. Título y Resumen
J. Apreciación
K. Encuesta
L. Composición
M. Presentación oral