¿Cuál es la diferencia entre Machine Learning y Deep Learning?

  • El Deep Learning o es un tipo de Machine Learning, que es un subconjunto de la inteligencia artificial.
  • El Machine Learning se trata de que las computadoras puedan pensar y actuar con menos intervención humana; el Deep Learning se trata de que las computadoras aprendan a pensar utilizando estructuras modeladas en el cerebro humano.
  • El Machine Learning requiere menos potencia informática; el Deep Learning generalmente necesita menos intervención humana continua.
  • El Deep Learning puede analizar imágenes, videos y datos no estructurados de maneras que el Machine Learning no puede hacer fácilmente.
  • Cada industria tendrá trayectorias profesionales que impliquen Machine Learning y Deep Learning.

¿Qué es la inteligencia artificial (IA)?

La Inteligencia Artificial (IA) es una ciencia dedicada a hacer que las máquinas piensen y actúen como humanos.

Esto puede sonar simple, pero ninguna computadora existente comienza a coincidir con las complejidades de la inteligencia humana. Las computadoras sobresalen en la aplicación de reglas y la ejecución de tareas, pero a veces una “acción” relativamente directa para una persona podría ser extremadamente compleja para una computadora.

Por ejemplo, llevar una bandeja de bebidas a través de un bar lleno de gente y servirlas al cliente correcto es algo que los servidores hacen todos los días, pero es un ejercicio complejo en la toma de decisiones y basado en un alto volumen de datos que se transmiten entre las neuronas del cerebro humano.

Las computadoras aún no están allí, pero el Machine Learning y el Deep Learning son pasos hacia un elemento clave de este objetivo: analizar grandes volúmenes de datos y tomar decisiones/predicciones basadas en ellos con la menor intervención humana posible.

¿Qué es el Machine Learning?

Machine Learning es un subconjunto de inteligencia artificial que se centra en un objetivo específico: configurar computadoras para poder realizar tareas sin necesidad de una programación explícita.

Las computadoras reciben datos estructurados (en la mayoría de los casos) y “aprenden” para evaluar y actuar mejor sobre esos datos a lo largo del tiempo.

Piense en los “datos estructurados” como entradas de datos que puede poner en columnas y filas. Puede crear una columna de categoría en Excel llamada “comida”, y tener entradas de fila como “fruta” o “carne”. Esta forma de datos “estructurados” es muy fácil de trabajar para las computadoras, y los beneficios son obvios (no es coincidencia que uno de los lenguajes de programación de datos más importantes se llame “lenguaje de consulta estructurado“).

Una vez programada, una computadora puede recibir nuevos datos indefinidamente, clasificándolas y actuando sobre ellos sin necesidad de una mayor intervención humana.

Con el tiempo, la computadora puede ser capaz de reconocer que la “fruta” es un tipo de alimento, incluso si deja de etiquetar sus datos. Esta “autosuficiencia” es tan fundamental para el aprendizaje automático que el campo se divide en subconjuntos en función de la cantidad de ayuda humana continua involucrada.

Aprendizaje supervisado y aprendizaje semisupervisado

El aprendizaje supervisado es un subconjunto del Machine Learning que requiere la participación humana más continua, de ahí el nombre de “supervisado”. La computadora recibe datos de entrenamiento y un modelo diseñado explícitamente para “enseñarle” cómo responder a los datos.

Una vez que el modelo está en su lugar, se pueden introducir más datos en la computadora para ver qué tan bien responde, y el programador/científico de datos puede confirmar predicciones precisas, o puede emitir correcciones por cualquier respuesta incorrecta. Imagínese a un programador tratando de enseñar una clasificación de imágenes de computadora. Introdujeron imágenes y encargaban al ordenador que clasificara cada imagen, confirmando o corrigiendo la salida de cada computadora.

Con el tiempo, este nivel de supervisión ayuda a perfeccionar el modelo en algo que sea capaz de manejar con precisión nuevos conjuntos de datos que siguen los patrones “aprendidos”. Pero no es eficiente seguir monitoreando el rendimiento de la computadora y haciendo ajustes.

En el aprendizaje semisupervisado, la computadora se alimenta con una mezcla de datos correctamente etiquetados y datos no etiquetados, y busca patrones por sí sola. Los datos etiquetados sirven como “orientación” del programador, pero no emiten correcciones continuas.

Aprendizaje no supervisado

El aprendizaje no supervisado lleva esto un paso más allá al usar datos no etiquetados. A la computadora se le da la libertad de encontrar patrones y asociaciones como mejor le parezca, a menudo generando resultados que podrían haber sido evidentes para un analista de datos humanos.

Un uso común para el aprendizaje no supervisado es la “agrupación”, donde la computadora organiza los datos en temas y capas comunes que identifica. Los sitios web de compras/comercio electrónico utilizan rutinariamente esta tecnología para decidir qué recomendaciones hacer a usuarios específicos en función de sus compras anteriores.

Aprendizaje de refuerzo

En el aprendizaje supervisado y no supervisado, no hay “consecuencia” para la computadora si no entiende o categoriza adecuadamente los datos. Pero, ¿qué pasaría si, como un niño en la escuela, recibiera comentarios positivos cuando hizo lo correcto, y comentarios negativos cuando hizo lo incorrecto? La computadora presumiblemente comenzaría a averiguar cómo hacer el trabajo de tareas específicas a través de la prueba y el error, sabiendo que está en el camino correcto cuando recibe una recompensa (por ejemplo, una puntuación) que refuerza su “buen comportamiento”.

Este tipo de aprendizaje reforzado es fundamental para ayudar a las máquinas a dominar tareas complejas que vienen con conjuntos de datos grandes, altamente flexibles e impredecibles. Esto abre la puerta a computadoras que están tratando de lograr un objetivo: realizar cirugía, conducir un automóvil, escanear el equipaje en busca de objetos peligrosos, etc.

¿Para qué se utiliza el Machine Learning hoy en día?

Es posible que se sorprenda al descubrir que interactúa con las herramientas de Machine Learning todos los días. Google lo usa para filtrar spam, malware e intentos de phishing de su bandeja de entrada. Su banco y tarjeta de crédito lo utilizan para generar advertencias sobre transacciones sospechosas en sus cuentas. Cuando hablas con Siri y Alexa, el Machine Learning impulsa las plataformas de reconocimiento de voz y voz en el trabajo. Y cuando su médico lo envía a un especialista, el Machine Learning puede estar ayudándole a escanear las radiografías y los resultados de los análisis de sangre en busca de anomalías como el cáncer.

A medida que las aplicaciones continúan creciendo, las personas recurren al Machine Learning para manejar tipos de datos cada vez más complejos. Hay una fuerte demanda de computadoras que puedan manejar datos no estructurados, como imágenes o videos. Y aquí es donde el Deep Learning entra en escena.

¿Qué es el Deep Learning?

El Deep Learning se trata de que las computadoras puedan realizar tareas sin estar programadas explícitamente… pero las computadoras todavía piensan y actúan como máquinas. Su capacidad para realizar algunas tareas complejas, recopilar datos de una imagen o vídeo, por ejemplo, todavía está muy por debajo de lo que los humanos son capaces de hacer.

Los modelos de Deep Learning introducen un enfoque extremadamente sofisticado para el Machine Learning y están listos para abordar estos desafíos porque han sido modelados específicamente según el cerebro humano. Las “redes neuronales profundas” complejas y de múltiples capas están construidas para permitir que los datos pasen entre nodos (como neuronas) de maneras altamente conectadas. El resultado es una transformación no lineal de los datos que es cada vez más abstracta.

Si bien se necesitan enormes volúmenes de datos para “alimentar y construir” dicho sistema, puede comenzar a generar resultados inmediatos, y hay relativamente poca necesidad de intervención humana una vez que los programas están en marcha.

Tipos de algoritmos de Deep Learning

Un número creciente de algoritmos de aprendizaje profundo hacen que estos nuevos objetivos sean alcanzables. Cubriremos dos aquí solo para ilustrar algunas de las formas en que los científicos e ingenieros de datos están aplicando el Deep Learning en el campo.

Redes neuronales convolucionales

Las redes neuronales convolucionales son algoritmos especialmente construidos diseñados para trabajar con imágenes. La “convolución” en el título es el proceso que aplica un filtro basado en el peso en cada elemento de una imagen, ayudando a la computadora a comprender y reaccionar a los elementos dentro de la propia imagen.

Esto puede ser útil cuando necesita escanear un gran volumen de imágenes para un artículo o característica específica; por ejemplo, imágenes del fondo del océano en busca de signos de un naufragio, o una foto de una multitud para la cara de una sola persona.

Esta ciencia del análisis y la comprensión de imágenes/vídeos informáticos se llama “visión informática”, y representa un área de alto crecimiento en la industria en los últimos 10 años.

Redes neuronales recurrentes

Mientras tanto, las redes neuronales recurrentes introducen un elemento clave en el Machine Learning que está ausente en algoritmos más simples: la memoria. La computadora es capaz de tener “en cuenta” los puntos de datos y las decisiones anteriores, y considerarlos al revisar los datos actuales, introduciendo el poder del contexto.

Esto ha hecho de las redes neuronales recurrentes un foco importante para el trabajo de procesamiento del lenguaje natural. Al igual que con un humano, la computadora hará un mejor trabajo entendiendo una sección de texto si tiene acceso al tono y contenido que le precedieron. Del mismo modo, las instrucciones de conducción pueden ser más precisas si la computadora “recuerda” que todas las personas que siguen una ruta recomendada un sábado por la noche tardan el doble en llegar a donde van.

5 diferencias clave entre el Machine Learning y el Deep Learning

Si bien hay muchas diferencias entre estos dos subconjuntos de inteligencia artificial, aquí hay cinco de los más importantes:

1. Intervención humana

El Machine Learning requiere una intervención humana más continua para obtener resultados. El Deep Learning es más complejo de configurar, pero requiere una intervención mínima a partir de entonces.

2. Hardware

Los programas de Machine Learning tienden a ser menos complejos que los algoritmos de Deep Learning y a menudo se pueden ejecutar en computadoras convencionales, pero los sistemas de Deep Learning requieren hardware y recursos mucho más potentes. Esta demanda de energía ha impulsado un mayor uso de unidades de procesamiento gráfico. Las GPU son útiles para su memoria de alto ancho de banda y su capacidad para ocultar latencia (retrasos) en la transferencia de memoria debido al paralelismo de subprocesos (la capacidad de muchas operaciones para ejecutarse de manera eficiente al mismo tiempo).

3. Tiempo

Los sistemas de Machine Learning se pueden configurar y operar rápidamente, pero pueden estar limitados en el poder de sus resultados. Los sistemas de Deep Learning tardan más tiempo en configurarse, pero pueden generar resultados instantáneamente (aunque es probable que la calidad mejore con el tiempo a medida que se disponga de más datos).

4. Enfoque

El Machine Learning tiende a requerir datos estructurados y utiliza algoritmos tradicionales como la regresión lineal. El Deep Learning emplea redes neuronales y está construido para acomodar grandes volúmenes de datos no estructurados.

5. Aplicaciones

El Machine Learning ya está en uso en su bandeja de entrada de correo electrónico, banco y consultorio médico. La tecnología de Deep Learning permite programas más complejos y autónomos, como automóviles autónomos o robots que realizan cirugía avanzada.