Fundamentos de Data Warehousing

   - 1er Cuatrimestre 2004 -

 

Profesor: Dr. Alejandro Vaisman

   E-mail: avaisman@dc.uba.ar


Condiciones de cursada y aprobación

        - Correlativas : Bases de Datos con final aprobado al momento de comenzar la cursada

        - Aprobación :  Examen final (30%), proyecto (40%) exposición de un tema (20%), participación en clase/presentismo (10%). Asistencia minima: 70%.

        - Clases : Miércoles 17-20 hs. 

        - Modalidad: Teórico/práctica. Se explicarán los conceptos fundamentales de OLAP y Data Warehousing. Los alumnos desarrollarán el proyecto de un datawarehouse, incluyendo los procesos de extracción, limpieza y análisis de datos.  Para ellos definirán un entorno real (preferentemente) o ficticio. Se discutirán en clase los papers más relevantes del área, algunos de los cuales serán presentados por los alumnos, con la asistencia del docente. 

Programa y bibliografía
Libro de referencia de la materia: Multidimensional databases: problems and solutions

   Concurso Microstrategy/IBM ---> afiche

 

 

Clases 

        - Clase del 24/3/04 - Presentación del curso - Introducción  - bajar

        - Clase del 31/3/04 - Principios básicos - Diseño - bajar

       - Clase del 7/4/04 -  Vistas Materializadas - bajar

- Clase del 14/4/04 - [suspendida - a recuperar] Estimación tamaño de                  agregados 

- Operador Cube 

- Clase del 21/4/04  - Herramientas de Microstrategy -

- Clase del 28/4/04  - Herramientas de Microstrategy (continuación) -

- Clase del 5/5/04  -  Cómputo del data cube -

- Clase del 12/5/04 -  Updates en OLAP

- Clase del 17/5/04 -  Indices en OLAP

- Clase del 19/5/04 -  Sumarizabilidad - Mantenimiento de Data Warehouses on-line     (Algoritmo 2VNL)

- Clase del 26/5/04 -  Introducción a Data Mining

- Clase del 2/6/04 -   Reglas de Asociación- Algoritmo Apriori - Clustering

- Clase del 9/6/04 -   Algoritmo CURE (clustering) 

- Clase 17/6/04 -  Revision de jerarquias en  OLAP 

- Clase 23/6/04 - Control  y revisión del proyecto

- Clase 30/6/04 -  Control  y revisión del proyecto

- Clase 7/7/04 -  Pre-entrega del proyecto

- Clase 14/7/04 -  Entrega Final del proyecto - Examen Final

 

Apuntes - notas

      - Introducción a Data Warehousing - bajar  / ver.  

        - Data Warehousing  survey

       - Indices bitmap.

       - Slides Integración de Datos - bajar

 

Artículos

- Artículos de Ralph Kimball de Intelligent Enterprise
-
An Overview of Data Warehousing and OLAP Technology, Surajit Chaudhuri, Umesh     Dayal,ACM SIGMOD Record 26(1), Marzo 1997.

   

Papers

    SURVEYS

        - A Survey on Logical Models for OLAP Databases  Autores: Panos Vassiliadis, Timos Sellis.
         - Multidimensional Data Modeling for Complex Data. Autores: T.Pedersen, Christian S. Jensen.

    OLAP

        - Providing OLAP (on-line analytical processing) to user-analysts: An IT mandate. Technical report, 1993. Autores. E.F. Codd, S.B.  Codd, C.T. Salley 

    QUERY PROCESSING

        - Maintenance of Data Cubes and Summary Tables in a Warehouse. Autores: I.   Mumick, D.Quass, B.Mumick.
        - Implementing Data Cubes Efficiently. Autores: Harinarayan, Rajaraman, Ullman

       - On the Computation of Multidimensional Aggregates.Autores: S. Agarwal, R. Agrawal, P.M. Deshpande, A. Gupta, J.F. Naughton, R. Ramakrishnan, S. Sarawagi. Proc. VLDB '96, 506-521.

    CALIDAD


         - Data Warehouse Quality Design: A Review of the DWQ Project.  Autores: M. Jarke, Y. Vassiliou.  

       - Towards Quality -Oriented Data Warehouse Usage and Evolution. Autores: Vassiliadis y otros.

 
         - Data cube: a relational aggregation operator generalizing group-by, cross-tabs and subtotals. Autores: J. Gray, A. Bosworth, A. Layman, H. Pirahesh.Technical report.

    DATA INTEGRATION

        - Data Integration : a Theoretical Perspective. Autor: M. Lenzerini

        - Source Inconsistency and Incompleteness in Data Integration. Autores: D. Lembo, M.Lenzerini, R.Rosati

        - Data Integration : a Status Report. Autor: A. Halevy

    DATA WAREHOUSING EN LA WWW

        - Views in a large-scale XML repository. V. Aguilera, S.Cluet, T.Milo, P.Veltri, D.Vodislav.

    MISCELANEAS

        - OLAP Dimension Constraints. Autores: C.Hurtado, A. Mendelzon

          - Temporal Queries in OLAP. Autores: Alberto Mendelzon, Alejandro Vaisman.

        - An Adaptive Peer-to-Peer Network for Distributed Caching of OLAP Results. P. Kelnis, W. Ng, B.Ooi, D. Papadias, K. Tan. Technical report.   

Links varios:

-Bibliografia de Data Warehousing. 
-Larry Greenfield, Data Warehousing Information Center. (Web site)  
-Data Warehousing Online. (Web site)          
-Data Warehousing Knowledge Center. (Web site)

 

Bibliografía adicional recomendada:

-Kimball, R., The Data Warehouse Toolkit, John Wiley, 1996 (y otros libros de R. Kimball)

-Jarke y otros, Fundamentals of Data Warehouses, Springer-Verlag, 2000.