Aprendizaje profundo

La idea básica

A medida que se avanza en los campos de la tecnología, la ingeniería y la ciencia, empezamos a construir máquinas que pueden imitar con mayor precisión y éxito la inteligencia humana. La inteligencia artificial sigue evolucionando y trae consigo tanto entusiasmo como temores.

La inteligencia artificial es el campo general en el que se enseña a los ordenadores a imitar los patrones de pensamiento humano, que puede desglosarse en diferentes técnicas. Los subgrupos de la inteligencia artificial son el aprendizaje automático y el aprendizaje profundo.

El aprendizaje profundo es una técnica en la que las máquinas se programan de forma similar al cerebro humano. Al igual que el cerebro humano aprende de la experiencia, cuando las máquinas utilizan la técnica del aprendizaje profundo, emplean grandes cantidades de datos para desarrollar un algoritmo. Por ejemplo, los asistentes personales controlados por voz -como Siri en su teléfono- desarrollan un algoritmo aprendiendo de ejemplos. Para responder adecuadamente a las peticiones humanas, los algoritmos se alimentan de ejemplos de voces humanas haciendo peticiones.1

Incorporar la inteligencia general, la inteligencia corporal, la inteligencia emocional, la inteligencia espiritual, la inteligencia política y la inteligencia social en los sistemas de IA forma parte de la futura investigación en aprendizaje profundo.


- Amit Ray, autor indio y pionero del movimiento de inteligencia artificial compasiva, en su libroCompassionate Artificial Intelligence2

Términos clave

Inteligencia Artificial: técnica que permite a una máquina imitar el comportamiento humano. Es la ciencia y la ingeniería de máquinas que imitan la resolución de problemas y la toma de decisiones humanas.3

Aprendizaje automático: técnica para lograr inteligencia artificial mediante algoritmos y datos. Ayudó a sentar las bases del aprendizaje profundo.

Aprendizaje profundo: un tipo de inteligencia artificial en el que las máquinas se basan en la estructura y el funcionamiento del cerebro humano.

Conexionismo: teoría de la inteligencia artificial que intenta comprender cómo aprenden las personas y cómo funciona la memoria examinando y cartografiando el cerebro a nivel neuronal.4

Entradas inhibitorias: Una entrada que tiene un efecto máximo sobre la decisión que se está tomando. Independientemente de otros inputs, si éste está presente, se producirá un resultado concreto. Por ejemplo, un input como las cosquillas puede tener prioridad sobre todos los demás inputs y hacerte reír automáticamente. Se denominan inhibitorias porque impiden que otros inputs tengan importancia.5

Entradas excitadoras: Estas entradas, por sí solas, no provocan necesariamente que se dispare una salida, pero cuando se combinan con otras, pueden hacer que se produzca una salida.5

Función de activación: los canales de fórmulas, que se encuentran entre la entrada y la salida de una máquina, utilizados para determinar la salida.5

Máquina de Turing: modelo matemático que reduce un dispositivo informático a sus elementos esenciales.6 Cuando se trata de aprendizaje profundo, significa que reduce el cerebro a su estructura lógica esencial de neuronas disparándose.

Perceptrones: un tipo de red neuronal artificial investigada por Frank Rosenblatt.

Retropropagación de errores: algoritmo desarrollado por Rosenblatt que comprendió que los modelos de aprendizaje profundo debían incorporar tanto la retroalimentación como la realimentación. Cuando un ordenador está aprendiendo, las entradas que no dan lugar a la salida deseada siguen siendo útiles, ya que proporcionan una forma de retroalimentación de error.7

Historia

Las máquinas con capacidades similares a las humanas han sido objeto de interés y debate desde que la ciencia ficción les dio vida a mediados del siglo XX. Académicamente, el aprendizaje profundo se vinculó por primera vez a las investigaciones realizadas por Walter Pitts y Warren McCulloch. Walter Pitts era un lógico que trabajaba en el campo neurocientífico y Warren McCulloch era neurofisiólogo y cibernético (especialista en la ciencia de las comunicaciones en las máquinas).8

En 1943, Pitts y McCulloch crearon un modelo informático basado en las redes neuronales del cerebro. La pareja se trasladó de la Universidad de Chicago al Instituto Tecnológico de Massachusetts para trabajar en lo que hoy se considera el primer departamento de ciencia cognitiva. Diseñaron una máquina que imitaba la función de una neurona biológica. Una neurona recibe una señal a través de su dendrita, la procesa a través del soma y la transmite como salida a través de una estructura en forma de cable llamada axón. El axón se conecta a otras neuronas creando algún tipo de respuesta. Nuestros órganos sensoriales, como los ojos, interactúan con el entorno, reciben una señal, la procesan y emiten una respuesta.5

Por ejemplo, cuando vemos a un cómico, nuestro cerebro recibe la información (el chiste), la procesa, determina si es gracioso y desarrolla una respuesta (una carcajada). Pitts y McCulloch desarrollaron una máquina basada en este proceso cerebral en su artículo "A Logical Calculus of Ideas Immanent in Nervous Activity" (Un cálculo lógico de las ideas inherentes a la actividad nerviosa), y su modelo pasó a conocerse como la neurona M-P.5

La neurona M-P fue revolucionaria como uno de los primeros ejemplos de aprendizaje profundo. Era un modelo sencillo, ya que utilizaba una función de entrada binaria, en la que sólo podían producirse dos entradas simultáneamente. En 1958, Frank Rosenblatt, un psicólogo estadounidense, propuso un nuevo modelo: el modelo perceptrón clásico que utilizaba la neurona artificial. Su modelo introdujo más ponderaciones, de modo que algunas entradas podían tener un mayor impacto en el resultado que otras. Las entradas podían ser inhibitorias, y anular todas las demás, o excitatorias. 5

A lo largo de los años, lógicos, neuropsicólogos y psicólogos han seguido perfeccionando el modelo y mejorando los sistemas de aprendizaje profundo, lo que ha permitido que los algoritmos de máquinas y ordenadores se parezcan cada vez más a la mente humana. Según Terrence Sejnowski, neurocientífico que desempeñó un papel importante en la fundación del aprendizaje profundo, el momento en que este se popularizó fue en 2012, en una conferencia sobre inteligencia artificial. En esta conferencia, el informático Geoffrey Hinton demostró que se podía tomar un gran conjunto de datos, al que llamaron ImageNet, que tenía 10.000 categorías y 10 millones de imágenes, y que el aprendizaje profundo era capaz de clasificar estas imágenes un 20% mejor que el aprendizaje automático9.

Personas

Walter Pitts

Lógico que empezó a trabajar en neurociencia siendo adolescente. Fue pionero de la teoría cibernética, ya que trató de utilizar la lógica para trazar la funcionalidad del cerebro humano. A partir de la comprensión de las operaciones fundamentales de la lógica, como las conjunciones (y), las disyunciones (o) y la negación (no), creía poder entender también el modo en que el cerebro humano tomaba decisiones. Pensaba que la configuración de las neuronas en nuestro cerebro era binaria: o las células se disparan y producen una respuesta, o no lo hacen. A través de esta teoría, Pitts trabajó con McCulloch para desarrollar la neurona M-P, el primer modelo de aprendizaje profundo.10

Warren McCulloch

Neurofisiólogo que abordó el campo a través del conexionismo. Junto con Pitts, Mculloch desarrolló el primer modelo de aprendizaje profundo entendiendo el cerebro como una máquina de computación. McCulloch describió su proceso como convertir el cerebro humano en una máquina de Turing.4

Frank Rosenblatt

Informático estadounidense que trabajaba en el Laboratorio Aeronáutico de Cornell cuando realizó importantes avances en el campo de la inteligencia artificial. Mediante simulaciones informáticas y análisis matemáticos detallados, investigó los perceptrones y se dio cuenta de que el cerebro era una red multicapa, no una red binaria de dos capas. También desarrolló el algoritmo de retropropagación de errores del aprendizaje profundo.11

Terrence Sejnowski

Neurocientífico computacional estadounidense y pionero del estudio de los algoritmos de aprendizaje. En la década de 1980, cuestionó el tipo de lógica y símbolo del aprendizaje automático con el que funcionaba actualmente la inteligencia artificial. Su libro,The Deep Learning Revolution, repasa cómo el aprendizaje profundo pasó de ser un pequeño interés académico a una tecnología disruptiva integrada en todos los aspectos de nuestras vidas.12

Geoffrey Hinton

Psicólogo cognitivo e informático británico-canadiense, más conocido por sus trabajos sobre redes neuronales artificiales utilizadas en el aprendizaje profundo. En el mundo de la informática, en 2009 comenzó una competición llamada ImageNet, que retaba a los equipos a construir un ordenador capaz de reconocer 1.000 objetos. Durante tres años, ningún equipo había tenido éxito, pero en 2012, Hinton y su equipo desarrollaron por fin un ordenador que funcionaba según el aprendizaje profundo y podía reconocer con precisión más de 10 millones de objetos13.

Consecuencias

El aprendizaje profundo consiste en entender el cerebro como una red neuronal, lo que nos permite crear máquinas que imiten los mismos algoritmos que nuestro cerebro.

Antes del aprendizaje profundo, los informáticos intentaban conseguir inteligencia artificial mediante el aprendizaje automático. Con el aprendizaje automático, los humanos deben programar sistemas con algoritmos que comprueben cosas específicas al analizar los datos y cuál es el resultado adecuado. Por ejemplo, si quieres que una máquina distinga entre manzanas y naranjas, tendrías que introducir las diferentes características de las manzanas y las naranjas. Desarrollarías un algoritmo para el sistema de aprendizaje automático, como "si es roja y/o tiene un tallo y/o una superficie brillante, entonces es una manzana". Esto significa que el aprendizaje automático sólo puede utilizarse para encontrar características preprogramadas y sólo ayuda a analizar datos con un enfoque específico y limitado.14

Cuando se trata de aprendizaje profundo, no tenemos que programar las características en un algoritmo, ya que desarrolla su propio algoritmo después de analizar grandes cantidades de datos. La máquina aprenderá mediante el procesamiento de datos a través de su red neuronal, sin intervención humana14.

Si un ordenador estuviera programado según el aprendizaje automático y se encontrara con una manzana de aspecto inusual, podría no reconocerla como manzana porque ha sido programado para mirar y clasificar únicamente en función de tres características: color, tallo y superficie brillante. El aprendizaje profundo, que ha creado su propio sistema después de encontrarse con cientos de manzanas, tiene más probabilidades de seguir siendo capaz de identificar una manzana que tiene características variables o atípicas.14 El aprendizaje profundo funciona mejor cuantos más datos encuentra, mientras que el aprendizaje automático funciona peor porque no está tan en sintonía con las variables de los datos.15

El aprendizaje profundo ha revolucionado lo que pueden hacer los ordenadores. El reconocimiento facial y la detección de objetos a partir de fotografías o vídeos son posibles gracias al aprendizaje profundo. Los vehículos automáticos -sin conductor- también son posibles gracias al aprendizaje profundo. Siri, Alexa o Hey Google también son posibles gracias al aprendizaje profundo. Las posibilidades son infinitas.15

Controversias

El aprendizaje profundo permite a las máquinas procesar más datos y decidir una respuesta adecuada incluso cuando se encuentran con variables, lo que se cree que las hace más "inteligentes" que un algoritmo preprogramado. Sin embargo, como el aprendizaje profundo significa que las máquinas aprenden por sí solas sin intervención humana, aprender cuál es la salida adecuada para cada dato requiere mucha práctica. Para que el aprendizaje profundo funcione realmente mejor que el aprendizaje automático, los ordenadores deben encontrar muchos datos para formar rutas neuronales entre una entrada y una salida deseada.15

Dado que el aprendizaje profundo requiere grandes cantidades de datos, también puede resultar muy caro. El complejo modelo de datos requiere maquinaria de última generación que cuesta mucho.15 Sin embargo, a medida que avanzamos en tecnología, los ordenadores y otras máquinas de inteligencia artificial son cada vez menos costosos, mientras que la mano de obra humana es cada vez más cara. Dado que el aprendizaje profundo no requiere programación ni intervención humana, podría afirmarse que, a largo plazo, es en realidad más barato.9

Análisis de imágenes médicas

Para averiguar si algo va mal mediante imágenes médicas, los ordenadores tienen que ser capaces de analizar imágenes e identificar si hay algo anormal en la imagen. Sin embargo, antes del aprendizaje profundo, estos ordenadores tenían que ser programados con lo que debían buscar, lo que les daba una tarea de enfoque muy limitado. Podían programarse para encontrar rastros de una enfermedad específica, pero si había una anomalía externa a esa enfermedad, categorizaría la imagen médica como normal. Los radiólogos tendrían que saber exactamente qué buscar para saber qué algoritmo programar.16

Ahí es donde entra en juego el aprendizaje profundo, que puede ser especialmente útil para analizar radiografías de tórax. Hay una miríada de anomalías en las radiografías de tórax, lo que, según los investigadores de inteligencia artificial de Google, "hace que sea poco práctico detectar todas las condiciones posibles mediante la construcción de múltiples sistemas separados, cada uno de los cuales detecta una o más condiciones preespecificadas." 16

Por eso, los investigadores de inteligencia artificial de Google construyeron un sistema de aprendizaje profundo que puede detectar si una radiografía de tórax es anormal o no.16 Aunque puede que no nos informe exactamente de lo que va mal, permite a los radiólogos saber qué casos necesitan su atención y qué casos pueden excluirse, lo que acelera el proceso clínico. Ya no es necesario realizar una prueba tras otra. Basta una prueba para ver una señal de alarma e investigar en consecuencia.

Entonces, ¿cómo construyeron los investigadores un sistema de aprendizaje profundo fiable que pudiera detectar anomalías peligrosas, pero no detectara anomalías benignas? Los ingenieros de aprendizaje profundo a menudo se enfrentan al reto de que sus máquinas se vuelvan sensibles a factores irrelevantes. Por ejemplo, un sistema de aprendizaje profundo diseñado para uso médico en la detección de cáncer de piel empezó a detectar marcas de regla en la piel y a clasificar esas imágenes como cancerosas.16

La respuesta está en el big data: cuantos más datos, mejor será el sistema de aprendizaje profundo. Los investigadores construyeron el sistema utilizando 250.000 radiografías de cinco hospitales de la India y, a continuación, evaluaron si era preciso también cuando se trataba de exploraciones de otros países mediante referencias cruzadas con radiografías de China y Estados Unidos16.

Aunque la investigación de Google aún no hace obsoletos a los radiólogos, su sistema es sin duda una herramienta útil para la eficiencia y la precisión.

Contenido TDL relacionado

Aprendizaje automático e intervenciones personalizadas: David Halpern

Si siente curiosidad por el aprendizaje automático, el sistema de inteligencia artificial inicial del que surgió el aprendizaje profundo, este episodio del podcast es para usted. David Halpern, director general del equipo Behavioral Insights, habla sobre el futuro de la ciencia del comportamiento, cómo el aprendizaje automático se vincula a la ciencia del comportamiento y cómo permite las intervenciones personalizadas, que en su opinión son el futuro de la ciencia del comportamiento.

Algoritmos para simplificar la toma de decisiones (1/2): El caso de las prótesis cognitivas

El aprendizaje profundo subcontrata la función cognitiva humana a ordenadores y máquinas. Imita y ayuda a nuestras propias capacidades de toma de decisiones facilitando el análisis de datos. La toma de decisiones algorítmica, que es la analítica desplegada para tomar mejores decisiones basadas en datos, parece estar en todas partes. En esta historia en dos partes, nuestro colaborador Jason Burton explora cómo el aprendizaje profundo y la toma de decisiones algorítmica podrían utilizarse como una herramienta que ayude o amplíe nuestras capacidades cognitivas.

Fuentes

  1. Marr, B. (2018, 1 de octubre). Qué es la IA de aprendizaje profundo? Una guía sencilla con 8 ejemplos prácticos. Forbes. https://www.forbes.com/sites/bernardmarr/2018/10/01/what-is-deep-learning-ai-a-simple-guide-with-8-practical-examples/?sh=1e1073888d4b
  2. Citas sobre aprendizaje profundo. (sin fecha). Goodreads. Extraído el 22 de septiembre de 2021, de https://www.goodreads.com/quotes/tag/deep-learning
  3. ¿Qué es el aprendizaje profundo? (2020, 1 de mayo). IBM. https://www.ibm.com/cloud/learn/deep-learning
  4. Copeland, B. J. (2020, 9 de enero). Connectionism. Encyclopedia Britannica. https://www.britannica.com/technology/connectionism-artificial-intelligence
  5. Chandra, A. L. (2018, 7 de noviembre). Historia del perceptrón. Medium. Recuperado el 22 de septiembre de 2021, de https://towardsdatascience.com/mcculloch-pitts-model-5fdf65ac5dd1
  6. Máquina de Turing. (2020, 3 de abril). Enciclopedia Británica. https://www.britannica.com/technology/Turing-machine
  7. Whittington, J. C., & Bogacz, R. (2019). Teorías de retropropagación de errores en el cerebro. Trends in Cognitive Sciences, 23(3), 235-250. https://doi.org/10.1016/j.tics.2018.12.005
  8. Foote, K. D. (2017, 31 de enero). Breve historia del aprendizaje profundo. DATAVERSITY. https://www.dataversity.net/brief-history-deep-learning/
  9. Chen, A. (2018, 16 de octubre). Un científico pionero explica el 'aprendizaje profundo'. The Verge. https://www.theverge.com/2018/10/16/17985168/deep-learning-revolution-terrence-sejnowski-artificial-intelligence-technology
  10. Gefter, A. (2015, 5 de febrero), El hombre que intentó redimir al mundo con la lógica. Nautilus. https://nautil.us/issue/21/information/the-man-who-tried-to-redeem-the-world-with-logic
  11. Copeland, B. J. (2015, 8 de noviembre). Perceptrons. Encyclopedia Britannica. https://www.britannica.com/technology/perceptrons
  12. La revolución del aprendizaje profundo. (sin fecha). The MIT Press. Consultado el 22 de septiembre de 2021 en https://mitpress.mit.edu/books/deep-learning-revolution.
  13. Hao, K. (2020, 3 de noviembre). Geoff Hinton, pionero de la IA: "El aprendizaje profundo va a poder hacerlo todo". MIT Technology Review. https://www.technologyreview.com/2020/11/03/1011616/ai-godfather-geoffrey-hinton-deep-learning-will-do-everything/
  14. Simplilearn. (2019, 3 de junio). Aprendizaje profundo en 5 minutos | ¿Qué es el aprendizaje profundo? | Aprendizaje profundo explicado de forma sencilla | Simplilearn [Vídeo]. YouTube. https://www.youtube.com/watch?v=6M5VXKLf4D4
  15. Ventajas del Deep Learning | desventajas del Deep Learning. (sin fecha). RF Wireless World. Recuperado el 22 de septiembre de 2021, de https://www.rfwireless-world.com/Terminology/Advantages-and-Disadvantages-of-Deep-Learning.html.
  16. Dickson, B. (2021, 15 de septiembre). El nuevo sistema de aprendizaje profundo de Google puede ayudar a los radiólogos. VentureBeat. https://venturebeat.com/2021/09/16/googles-new-deep-learning-system-can-give-a-boost-to-radiologists/

Read Next

Notes illustration

Eager to learn about how behavioral science can help your organization?