Estadística y Data Mining


1er cuatrimestre 2014


DEPARTAMENTO DE COMPUTACION

FACULTAD DE CIENCIAS EXACTAS Y NATURALES

UNIVERSIDAD DE BUENOS AIRES


INFO DE LA MATERIA

PROGRAMA DE LA MATERIA

BIBLIOGRAFIA

DIRECCIONES DE DATA MINING

DOCENTE








MATERIA


1. DEPARTAMENTO: Computación

2. CUATRIMESTRE: Primero 2014

3. ASIGNATURA: Estadística y Data Mining

4. CARRERA: Se ofrece para Licenciatura en Ciencias de la Computación, Licenciatura en Ciencias Biológicas, Licenciatura en Ciencias Químicas, Licenciatura en Ciencias Matemáticas, y doctorados

5. CARÁCTER DE LA MATERIA: Optativa

6. NUMERO DE CÓDIGO DE CARRERA: 18

7. NUMERO DE CÓDIGO DE MATERIA: C ......

8. PUNTAJE: 3

9. PLAN DE ESTUDIOS AÑO: 1993

10. DURACIÓN DE LA MATERIA: Cuatrimestral

11. HORAS DE CLASE SEMANAL: a) TEORICAS: 3 hs --- b) LABORATORIO: 2 hs --- c) PRACTICAS: 1h

12. CARGA HORARIA TOTAL: 6 hs

13. ASIGNATURAS CORRELATIVAS: Probabilidades y Estadística o Biometría o Estadística para químicos

14. FORMA DE EVALUACION: Dos parciales, un examen final y un trabajo de aplicación




PROGRAMA DE LA MATERIA


Estadística y Data Mining. Materia de Grado y Posgrado: Computación

Objetivo: Los métodos del Análisis de Datos tienen por objetivo proveer una síntesis global de un conjunto de datos, basándose en que no tenemos hipótesis previas sobre conjunto total de datos.

El principio que guía este curso es introducir a los estudiantes en técnicas estadísticas multivariadas y familiarizarlos con el software que se utiliza en la resolución de problemas diversos.

El dominio de los métodos estadísticos, conjuntamente con las herramientas informáticas de manejo y análisis de bases de datos de gran dimensión es un dominio de amplia difusión en la actualidad y de suma importancia en el desenvolvimiento profesional.


Programa: Análisis exploratorio y confirmatorio. Reseña histórica. Técnicas descriptivas multidimensionales. Representaciones gráficas multidimensionales. Análisis en componentes principales. Análisis factorial de correspondencias. Métodos de clasificación y agrupamiento. Clasificación Jerárquica. K-medias. Caras de Chernov. Gráficos de estrellas. Gráficos de Rayos. Gráficos de Andrews. Relación entre Análisis factorial y Clasificación. Análisis discriminante. Métodos de segmentación. Árboles de decisión. Otros elementos de Data mining.



BIBLIOGRAFÍA


Benzecri J.P.& F. L'Analyse des données. Dunod, París, 1980.

Berry Michael J. A., Linoff Gordon Data Mining Techniques for Marketing Sales and Customer Support. John Wile& Sons, 1997.

Chatfield C., Collins A.J. Introduction to multivariate analysis. Chapman and Hall, London, 1980.

Hoaglin D.C., Mosteller F., Tukey J.W. Exploring Data tables. Trends and Shapes, Wiley, N.Y., 1985.

Jambu M. Classification Automatique pour l'Analyse des données. Dunod, París, 1978.

Johnson Dallas E. Métodos multivariados aplicados al análisis de datos. Thomson editores, Méjico, 1998.

Johnson R.A. , Wichern Dean W. Applied Multivariare Statistical Analysis. 3rd De. Prentice Hall Inc., USA, 1992.

Lebart L., Morineau A., Tabard N. Téchniques de la description statistique. Dunod, París, 1977.

Lebart L., Morineau A., Piron Marie. Statistique exploratoire multidimensionelle. Dunod, Paris, 1995.

Pla , Laura E. Análisis Multivariado: Método de Componentes Principales. Monografía Nº 27 Serie de matemática O.E.A.Washington. USA. 1986.

[MIC-SPI-TAY/94] Machine Learning, Neural and Statistical Classification.



DIRECCIONES DE DATA MINING


http://ece.wpi.edu:8080/infoeng/textbook/node92.html

http://cns.bu.edu/pub/cn550/project97/algorithms/Decision_Trees.html

http://kdd.ics.uci.edu/

http://www.ics.uci.edu/~mlearn/MLRepository.html

http://www.dmg.org/

http://www.icpsr.umich.edu/DDI

http://www.acm.org./sigs/sigkdd/explorations

http://cm.bell.labs.com/cm/ms/departments/sia/jmc

http://www.research.microsoft.com/~Gray

http://www.research.att.com/~amo

http://cns.bu.edu/pub/cn550/project97/algorithms/Decision_Trees.html



DOCENTE


Profesora:

Ana Silvia Haedo







¡Mirá acá la Presentación de la materia!