Tecnologías del habla – 2° Cuatrimestre 2002

 

Cronograma y Bibliografía

 

Fecha

Tema

Bibliografía

1  26/8

 

L

Motivaciones para las tecnologías del habla. Arquitecturas de los sistemas de procesamiento del lenguaje oral.

Bibliografía obligatoria: Huang et al. (2001) Cap. 1

2  29/8

 

 

 

 

 

J

Estructura del lenguaje oral. Acústica. Fonética y fonología. Sílabas y palabras. Sintaxis y semántica.

Bibliografía obligatoria: Huang et al. (2001) Cap. 2; Sánchez León (1994); Apunte 1

 

Bibliografía optativa: Jurafsky y Martin (2000) Caps. 1 y 4

Práctica ; Página de discusión

3    2/9

 

 

 

L

Elementos básicos de teoría de probabilidades y de inferencia estadística. Teoría de la información: entropía, entropía condicional, codificación e información mutua.

Bibliografía obligatoria: Huang et al. (2001) Cap. 3

 

Bibliografía optativa: Jelinek (1998) Cap. 7

4    5/9

J

Práctica: Análisis acústico.

Bibliografía obligatoria: Lieberman y Blumstein (1988); Manual de PRAAT.

5    9/9

 

 

L

Elementos de reconocimiento de patrones. Teoría bayesiana de decisión. Construcción de clasificadores.

Bibliografía obligatoria: Huang et al. (2001) Cap. 4

 

Bibliografía optativa: Vapnik (2000), Cap. 1; Hand (1981);

6      12/9

 

J

Métodos de estimación no supervisados. Arboles de clasificación y regresión.

Bibliografía obligatoria: Huang et al. (2001) Cap. 4

 

Bibliografía optativa: Jelinek (1998), Cap. 10

7      16/9

 

 

L

Elementos de procesamiento digital de señales. Sistemas y señales digitales. Transformadas de frecuencias continuas y no continuas. Filtros y ventanas digitales.

Bibliografía obligatoria: Huang et al. (2001) Cap. 5; Apunte 2

 

Bibliografía optativa: Proakis y Manolakis (1998)

8      19/9

 

 

J

Procesamiento digital de señales analógicas. Procesamiento de tasa múltiple. Bancos de filtros. Procesos estocásticos.

Bibliografía obligatoria: Huang et al. (2001) Cap. 5; Apunte 2

 

Bibliografía optativa: Proakis y Manolakis (1998)

9       23/9

 

 

L

Representaciones de la señal de habla. Análisis de Fourier de lapsos breves. Modelo acústico de la producción del habla. Codificación lineal predictiva (LPC). Procesamiento cepstral.

Bibliografía obligatoria: Huang et al. (2001) Cap. 6

 

Bibliografía optativa: Lieberman y Blumstein (1988), Caps. 3 a 5

10     26/9

 

J

Representaciones motivadas perceptualmente. Formantes. Altura tonal. Codificación del habla: características y tipos de codificadores del habla.

Bibliografía obligatoria: Huang et al. (2001) Caps. 6 y 7

L     30/9

Consulta

 

J      3/10

PRIMER PARCIAL

Preguntas Teóricas

11    7/10

 

 

L

Modelos Markovianos Ocultos. Cadenas markovianas. Modelo oculto. Algoritmos Forward, Forward-Backward, Viterbi, Baum-Welch.

Bibliografía obligatoria: Huang et al. (2001) Cap. 8

 

Bibliografía optativa: Jelinek (1997), Caps. 2 y 9

12   10/10

 

 

J

HMMs continuos y semicontinuos. Cuestiones prácticas y limitaciones.

Bibliografía obligatoria: Huang et al. (2001) Cap. 8

 

Bibliografía optativa: Jelinek (1997), Caps. 2 y 9

13   14/10

 

 

L

Modelización acústica. Variabilidad en la señal de habla. Errores de reconocimiento. Extracción de rasgos. Modelización fonética: selección de unidades.

Bibliografía obligatoria: Huang et al. (2001) Cap. 9

 

Bibliografía optativa: Jelinek (1997), Cap. 3

14   17/10

 

 

J

Modelización acústica: Peso de rasgos acústicos. Técnicas adaptativas. Técnicas alternativas al HMM. Robustez ambiental.

Bibliografía obligatoria: Huang et al. (2001) Caps. 9 y 10

 

Bibliografía optativa: Jelinek (1997), Cap. 3

15   21/10

 

 

 

L

Modelización del lenguaje. Teoría de lenguajes formales y parsing. Modelos estocásticos del lenguaje. Medida de complejidad de los modelos de lenguajes.

Bibliografía obligatoria: Huang et al. (2001) Cap. 11

 

Bibliografía optativa: Jelinek (1997), Caps. 4 y 8; Jurafsky y Martin (2000), Cap. 6

16   24/10

 

 

 

J

Suavizamiento de modelos de n-gramas. Modelos adaptativos. Cuestiones prácticas.

Bibliografía obligatoria: Huang et al. (2001) Cap. 11

 

Bibliografía optativa: Jelinek (1997), Caps. 4 y 8; Jurafsky y Martin (2000), Cap. 6

17   28/10

 

 

L

Algoritmos básicos de búsqueda. Búsqueda en grafos. Planteo general de algoritmos de búsqueda para reconocimiento de habla. Espacios de estados y modelos del lenguaje.

 

Bibliografía obligatoria: Huang et al. (2001) Cap. 12

 

Bibliografía optativa: Jelinek (1997), Caps. 5 y 6, The Virtual Lecture Project

18   31/10

 

 

J

Algoritmos de búsqueda para el reconocimiento de habla: Viterbi y Stack decoding (A*).

Bibliografía obligatoria: Huang et al. (2001) Cap. 12

 

Bibliografía optativa: Jelinek (1997), Caps. 5 y 6

19    4/11

 

 

L

Algoritmos de búsqueda con vocabularios grandes. Manipulación eficiente de léxico en árbol. Otras estrategias eficientes de búsqueda. Evaluación de algoritmos de búsqueda.

Bibliografía obligatoria: Huang et al. (2001) Cap. 13

 

Bibliografía optativa:

20    7/11

 

 

J

Síntesis de habla. Sistemas TTS. Análisis textual y fonético. Léxico, estructura de un documento, normalización. Análisis lingüístico. Desambiguación de homógrafos. Análisis morfológico. Conversión letra a sonido (LTS). Evaluación de sistemas TTS.

Bibliografía obligatoria: Huang et al. (2001) Cap. 14; Apunte 3

 

Bibliografía optativa: Dutoit (1993), Caps. 1 a 3; Manuales de FESTIVAL

21   11/11

 

 

L

Síntesis de habla. Prosodia. Esquema de generación de prosodia. Estilo de habla. Prosodia simbólica. Asignación de duraciones. Generación de altura tonal (pitch). Lenguajes de marcación de prosodia. Evaluación de la prosodia

Bibliografía obligatoria: Huang et al. (2001) Cap. 15

 

Bibliografía optativa:

22   14/11

 

J

Síntesis de formantes del habla. Síntesis por concatenación. Modificación prosódica del habla. Modelos de fuente-filtro de la modificación prosódica. Evaluación de sistemas TTS.

Bibliografía obligatoria: Huang et al. (2001) Cap. 16

 

Bibliografía optativa:

23  18/11

 

 

L

Comprensión del lenguaje hablado. Lenguajes hablados versus escritos. Estructura del diálogo. Interpretación de oraciones. Estructura del discurso. Gestión del diálogo.  Generación de respuestas. Evaluación.

Bibliografía obligatoria: Huang et al. (2001) Cap. 17

 

Bibliografía optativa:

24   21/11

 

J

Aplicaciones e interfases de usuario. Aplicaciones típicas. Diseño de interfases de habla. Internacionalización.

Bibliografía obligatoria: Huang et al. (2001) Cap. 18

 

Bibliografía optativa:

25/11

L

Consulta

 

28/11

J     

SEGUNDO PARCIAL

Preguntas Teóricas

2/12

L     

Recuperatorio Primer Parcial

 

5/12

J      

Recuperatorio segundo Parcial

 

16/12

L    

Entrega de trabajos finales

Trabajo final de síntesis

Trabajo final de reconocimiento