La tecnología de aprendizaje automático potencia muchos aspectos de la sociedad moderna: desde las búsquedas en la web y el filtrado de contenidos en las redes sociales hasta las recomendaciones sobre sitios web de comercio electrónico, y está cada vez más presente en productos de consumo como cámaras y teléfonos celulares. Los sistemas de aprendizaje automático se utilizan para identificar objetos, imágenes, transcribir el habla a texto, clasificar noticias, publicaciones o productos con los intereses de los usuarios, y seleccionar los resultados más relevantes de una búsqueda. Cada vez más, estas aplicaciones hacen uso de una clase de técnicas llamadas aprendizaje profundo.

Las técnicas convencionales de aprendizaje automático estaban limitadas en su capacidad de procesar datos naturales en su forma cruda. Durante décadas, la construcción de un sistema de reconocimiento de patrones o de aprendizaje automático requerían una ingeniería cuidadosa y considerable experiencia en el dominio para diseñar un extractor de características que transformara los datos brutos (como los valores de píxeles de una imagen) en una representación interna adecuada o un vector de características para los cuales el subsistema de aprendizaje, a menudo un clasificador, pudiera detectar o clasificar patrones en la entrada.

El aprendizaje de representación es un conjunto de métodos que permiten alimentar a una máquina con datos sin procesar y descubrir automáticamente las representaciones necesarias para la detección o clasificación. Los métodos de aprendizaje profundo son métodos de representación-aprendizaje con múltiples niveles de representación, obtenidos mediante la composición de módulos simples pero no lineales que transforman la representación en un nivel (comenzando con la entrada cruda) en una representación a un nivel más alto y ligeramente más abstracto . Con la composición de tales transformaciones, se pueden aprender funciones muy complejas. Para tareas de clasificación, capas superiores de representación amplifican aspectos de la entrada que son importantes para la discriminación y suprimen las variaciones irrelevantes. Una imagen, por ejemplo, viene en forma de una matriz de valores de píxeles, y las características aprendidas en la primera capa de representación típicamente representan la presencia o ausencia de aristas en orientaciones y ubicaciones particulares en la imagen. La segunda capa detecta típicamente motivos al detectar arreglos particulares de bordes, independientemente de pequeñas variaciones en las posiciones de los bordes. La tercera capa puede ensamblar motivos en combinaciones más grandes que correspondan a partes de objetos familiares, y las capas posteriores detectarían objetos como combinaciones de estas partes. El aspecto clave del aprendizaje profundo es que estas capas de características no son diseñadas por ingenieros humanos: son aprendidas de los datos usando un procedimiento de aprendizaje de propósito general.

El aprendizaje profundo ha logrado grandes avances en la solución de problemas que se resistieron a los mejores intentos de la comunidad de inteligencia artificial durante muchos años. Ha resultado ser muy efectivo para descubrir estructuras intrincadas en datos de alta dimensión y por lo tanto es aplicable a muchos dominios de la ciencia, los negocios y el gobierno. Además de batir records en reconocimiento de imágenes y reconocimiento de voz, ha superado otras técnicas de aprendizaje automático para predecir la actividad de moléculas potenciales de fármacos, analizar datos de aceleradores de partículas, reconstruir circuitos cerebrales y predecir los efectos de mutaciones en ADN no codificante sobre expresión génica y enfermedades. Tal vez más sorprendente, el aprendizaje profundo ha producido resultados muy prometedores para diversas tareas en la comprensión del lenguaje natural, en particular la clasificación de temas, análisis de sentimientos, respuesta a preguntas y traducción de idiomas.

Creemos que el aprendizaje profundo tendrá muchos más éxitos en un futuro próximo porque requiere muy poca ingeniería a mano, por lo que puede aprovechar fácilmente los incrementos en poder de procesamiento y datos disponibles. Los nuevos algoritmos de aprendizaje y arquitecturas que se están desarrollando actualmente para las redes neuronales profundas sólo acelerarán este progreso.

Fragmento extraído del artículo Deep Learning.