CC72S - Seminario: Fundamentos de

Data Warehousing

   - 2do Semestre 2006

 

Profesores: Dr. Carlos Hurtado; Dr. Alejandro Vaisman

   E-mail: (churtado@dcc.uchile.cl,avaisman@dcc.uchile.cl


Formato: La materia tendra formato de seminario. En las primera mitad del curso  se presentarán los fundamentos de OLAP y Data Warehousing. En la segunda mitad, cada participante del curso presentará un paper relevante a elegir en conjunto con la cátedra, y liderará una discusión sobre el mismo, con apoyo de la cátedra. Durante el curso se deberá realizar un proyecto, a definir con la  cátedra.

Clases : Martes 12 - 13:30 hs. (a confirmar) ; Jueves 10:15 a 11:45 hs

Modalidad: Teórico/práctica. 

Requisitos: CC42A ó CC55A

Programa y bibliografía

Libro de referencia de la materia: Multidimensional databases: problems and solutions

 

Clases 

        Clase 1. 25-7     - Presentación del curso. Introducción.

        Clase 2. 27-7 -     Introducción a Data Warehousing. Problemas. Diferencias entre bases

                                   de datos relacionales y DW.

        Clase 3. 1-8 -      Introducción a Data Warehousing. Diseño de un DW

        Clase 4. 3-8 -      Introducción a Data Warehousing. Diseño de un DW

        Clase 5. 8-8 -      Diseño de DW - Pautas

        Clase 6. 10-8 -    Vistas materializadas

        Clase 7. 15-8 -    El operador CUBE - Summary Tables

        Clase 8. 17-8 -    Cómputo de agregaciones  

        Clase 9. 22-8 -    Estimacion de agregados - armado de grupos de trabajo

        Clase 10.24-8 -   Indexación. Indices bitmap

        Clase 11. 29-8 -  Sumarizabilidad

        Clase 12. 31-8 -  Mantenimiento del DW

        Clase 13. 5-9 -   Temas avanzados en DW-OLAP/temas abiertos 

        Clase 14. 7-9 -    Clase de consulta sobre temas de proyecto - definición de temas

        Clase 15. 12-9 -  Sin clase

        Clase 16. 14-9 -  Sin clase

        Clase 17. 19-9 -  Presentación  de los  anteproyectos de   survey

        Clase 18. 21-9 Control

        Clase 19. 26-9 -  Corrección del control - Consultas sobre la presentación/survey

        Clase 20. 28-9 -  Tema a definir

        Clase 21. 3-10 -  Tema a definir

        Clase 22. 5-10  - Tema a definir

        Clase 23. 10-10 - Semana Olímpica

        Clase 24. 12-10 - Semana Olímpica

        Clase 25. 17-10 - Consultas sobre Presentación

        Clase 26. 19-10 - Presentación

        Clase 27. 24-10 - Presentación

        Clase 28. 26-10 - Presentación

        Clase 29. 2-11 - Presentación

        Clase 30. 7-11 - Sin clase

        Clase 31. 9-11 - Sin clase

        Clase 32. 14-11 - Presentación

        Clase 33. 16-11 - Presentación

 Apuntes - notas

       - Data Warehousing  survey

       - Indices bitmap.

       - Slides Integración de Datos - bajar

Artículos

- Artículos de Ralph Kimball de Intelligent Enterprise
-
An Overview of Data Warehousing and OLAP Technology, Surajit Chaudhuri, Umesh     Dayal,ACM SIGMOD Record 26(1), Marzo 1997.

 

Papers

    SURVEYS

        - A Survey on Logical Models for OLAP Databases  Autores: Panos Vassiliadis, Timos Sellis.

    OLAP

        - Providing OLAP (on-line analytical processing) to user-analysts: An IT mandate. Technical report, 1993.   Autores. E.F. Codd, S.B.  Codd, C.T. Salley 

         - Data cube: a relational aggregation operator generalizing group-by, cross-tabs and subtotals. Autores: J. Gray, A. Bosworth, A. Layman, H. Pirahesh.Technical report.

    QUERY PROCESSING

        - Maintenance of Data Cubes and Summary Tables in a Warehouse. Autores: I.   Mumick, D.Quass, B.Mumick.
        - Implementing Data Cubes Efficiently. Autores: Harinarayan, Rajaraman, Ullman

       - On the Computation of Multidimensional Aggregates.Autores: S. Agarwal, R. Agrawal, P.M. Deshpande, A. Gupta, J.F. Naughton, R. Ramakrishnan, S. Sarawagi. Proc. VLDB '96, 506-521.

    CALIDAD

       - Data Warehouse Quality Design: A Review of the DWQ Project.  Autores: M. Jarke, Y. Vassiliou.  

       - Towards Quality -Oriented Data Warehouse Usage and Evolution. Autores: Vassiliadis y otros.

    DATA INTEGRATION

        - Data Integration : a Theoretical Perspective. Autor: M. Lenzerini

        - Source Inconsistency and Incompleteness in Data Integration. Autores: D. Lembo, M.Lenzerini, R.Rosati

        - Data Integration : a Status Report. Autor: A. Halevy

    DATA WAREHOUSING EN LA WWW

        - Views in a large-scale XML repository. V. Aguilera, S.Cluet, T.Milo, P.Veltri, D.Vodislav.

    MISCELANEAS

          - OLAP Dimension Constraints. Autores: C.Hurtado, A. Mendelzon

          - Temporal Queries in OLAP. Autores: Alberto Mendelzon, Alejandro Vaisman.

         -  An Adaptive Peer-to-Peer Network for Distributed Caching of OLAP Results. P. Kelnis, W. Ng, B.Ooi, D. Papadias, K. Tan. Technical report.   

Links varios:

-Bibliografia de Data Warehousing. 
-Larry Greenfield, Data Warehousing Information Center. (Web site)  
-Data Warehousing Online. (Web site)          
-Data Warehousing Knowledge Center. (Web site)

 

Bibliografía adicional recomendada:

-Kimball, R., The Data Warehouse Toolkit, John Wiley, 1996 (y otros libros de R. Kimball)

-Jarke y otros, Fundamentals of Data Warehouses, Springer-Verlag, 2000.