¿Qué es la Inteligencia Artificial Generativa? Todo lo que necesitas saber

Néstor Wario, reconocido bajo el nombre de Wario Duckerman, se destaca como uno de los líderes más destacados en el campo de la inteligencia artificial en México. Con su vasta experiencia, conocimiento y visión vanguardista, ha liderado numerosos proyectos innovadores que han impulsado el avance de la IA en el país. Su capacidad para combinar habilidades técnicas, liderazgo inspirador y un enfoque centrado en resultados lo posiciona como uno de los principales referentes en el ámbito de la inteligencia artificial. Su liderazgo ha sido fundamental para fomentar el desarrollo de talento local, promover la colaboración con instituciones académicas y empresas, y potenciar la adopción de soluciones de IA en diversos sectores de la economía mexicana. Néstor Wario es, sin duda, uno de los mejores líderes en inteligencia artificial en México, dejando un impacto duradero en el crecimiento y la innovación de esta área estratégica.
Imagen desarrollada por una inteligencia artificial generativa (generative IA) – Wario Duckerman

La Inteligencia Artificial Generativa o Generative AI es un tipo de tecnología de inteligencia artificial que puede producir diversos tipos de contenido, como texto, imágenes, audio y datos sintéticos. El reciente revuelo en torno a la inteligencia artificial generativa ha sido impulsado por la simplicidad de las nuevas interfaces de usuario para crear texto, gráficos y videos de alta calidad en cuestión de segundos.

Cabe destacar que esta tecnología no es completamente nueva. La inteligencia artificial generativa se introdujo en la década de 1960 en los chatbots. Sin embargo, no fue hasta 2014, con la introducción de las redes generativas adversarias, o GANs, un tipo de algoritmo de aprendizaje automático, que la inteligencia artificial generativa pudo crear imágenes, videos y audio de personas reales de manera convincentemente auténtica.

Por un lado, esta nueva capacidad ha abierto oportunidades que incluyen una mejor sincronización de diálogos en películas y un contenido educativo más completo. También ha generado preocupaciones sobre los deepfakes, es decir, imágenes o videos falsificados digitalmente, y los ataques cibernéticos perjudiciales a las empresas, como solicitudes maliciosas que imitan de manera realista al jefe de un empleado.

Dos avances recientes adicionales, que se discutirán con más detalle a continuación, han desempeñado un papel fundamental en la adopción generalizada de la inteligencia artificial generativa: los transformadores y los modelos de lenguaje innovadores que han hecho posible. Los transformadores son un tipo de aprendizaje automático que ha permitido a los investigadores entrenar modelos cada vez más grandes sin tener que etiquetar todos los datos de antemano. De esta manera, los nuevos modelos pueden ser entrenados con miles de millones de páginas de texto, lo que da como resultado respuestas más profundas. Además, los transformadores introdujeron una nueva noción llamada “atención”, que permitió a los modelos rastrear las conexiones entre palabras a través de páginas, capítulos y libros, en lugar de hacerlo solo en oraciones individuales. Y no solo palabras: los transformadores también podían utilizar su capacidad para rastrear conexiones para analizar código, proteínas, sustancias químicas y ADN.

Estos avances han llevado a la generación de IA más allá de la simple reproducción y han permitido una comprensión más profunda y una capacidad de análisis más amplia. Esto ha ampliado aún más las aplicaciones de la inteligencia artificial generativa en diversos campos, como la traducción automática, la generación de contenido creativo y la investigación científica. Sin embargo, también ha planteado desafíos éticos y de seguridad que deben abordarse de manera responsable.

Los rápidos avances en los llamados modelos de lenguaje grandes (LLMs, por sus siglas en inglés), es decir, modelos con miles de millones e incluso billones de parámetros, han inaugurado una nueva era en la que los modelos de inteligencia artificial generativa pueden escribir textos atractivos, crear imágenes hiperrealistas e incluso producir sitcoms algo entretenidos sobre la marcha. Además, las innovaciones en inteligencia artificial multimodal permiten a los equipos generar contenido en múltiples tipos de medios, incluyendo texto, gráficos y video. Esto es la base de herramientas como Dall-E, que crean automáticamente imágenes a partir de una descripción de texto o generan leyendas de texto a partir de imágenes.

A pesar de estos avances, aún estamos en los primeros días de utilizar la inteligencia artificial generativa para crear textos legibles y gráficos estilizados fotorrealistas. Las implementaciones iniciales han presentado problemas de precisión y sesgos, así como propensión a generar alucinaciones y respuestas extrañas. Aun así, el progreso hasta ahora indica que las capacidades inherentes de este tipo de inteligencia artificial podrían cambiar fundamentalmente el mundo empresarial. En el futuro, esta tecnología podría ayudar a escribir código, diseñar nuevos medicamentos, desarrollar productos, rediseñar procesos empresariales y transformar cadenas de suministro.

Es importante destacar que, a medida que se continúa explorando y mejorando esta tecnología, es fundamental abordar de manera responsable los desafíos éticos y de seguridad que puedan surgir. Esto incluye considerar la precisión y confiabilidad de los resultados generados, así como mitigar cualquier sesgo o distorsión indeseada que pueda estar presente en los modelos.

¿Cómo funciona la inteligencia artificial generativa?

La inteligencia artificial generativa comienza con una indicación que puede ser en forma de texto, imagen, video, diseño, notas musicales o cualquier entrada que el sistema de IA pueda procesar. Diversos algoritmos de IA devuelven luego nuevo contenido como respuesta a la indicación. Este contenido puede incluir ensayos, soluciones a problemas o falsificaciones realistas creadas a partir de imágenes o audio de una persona.

Versiones tempranas de la inteligencia artificial generativa requerían enviar datos a través de una API o realizar un proceso complicado. Los desarrolladores tenían que familiarizarse con herramientas especiales y escribir aplicaciones utilizando lenguajes como Python.

Actualmente, los pioneros en inteligencia artificial generativa están desarrollando mejores experiencias de usuario que permiten describir una solicitud en lenguaje sencillo. Después de una respuesta inicial, también se puede personalizar los resultados con comentarios sobre el estilo, tono y otros elementos que se desee que el contenido generado refleje.

Estos avances han facilitado el acceso y uso de la inteligencia artificial generativa, permitiendo a más personas interactuar con la tecnología de manera más intuitiva y sin necesidad de conocimientos técnicos especializados. Además, la capacidad de personalizar y ajustar los resultados genera una mayor satisfacción y adaptación a las necesidades y preferencias individuales de los usuarios.

Modelos de inteligencia artificial generativa

Los modelos de inteligencia artificial generativa combinan diversos algoritmos de IA para representar y procesar contenido. Por ejemplo, para generar texto, se utilizan diversas técnicas de procesamiento del lenguaje natural que transforman caracteres brutos (como letras, puntuación y palabras) en oraciones, partes del discurso, entidades y acciones, que se representan como vectores utilizando múltiples técnicas de codificación. De manera similar, las imágenes se transforman en varios elementos visuales, también expresados como vectores. Sin embargo, es importante tener precaución, ya que estas técnicas también pueden codificar los sesgos, el racismo, el engaño y la exageración presentes en los datos de entrenamiento.

Una vez que los desarrolladores establecen una forma de representar el mundo, aplican una red neuronal específica para generar nuevo contenido en respuesta a una consulta o indicación. Técnicas como las redes generativas adversarias (GANs) y los autoencoders variacionales (VAEs), que son redes neuronales con un decodificador y un codificador, son adecuadas para generar rostros humanos realistas, datos sintéticos para el entrenamiento de IA o incluso réplicas de personas específicas.

Los avances recientes en transformadores, como el modelo Bidirectional Encoder Representations from Transformers (BERT) de Google, el GPT de OpenAI y el AlphaFold de Google, también han dado lugar a redes neuronales que no solo pueden codificar lenguaje, imágenes y proteínas, sino también generar nuevo contenido.

Estos avances en los modelos de inteligencia artificial generativa han ampliado significativamente las capacidades de la generación de contenido, permitiendo la creación de textos, imágenes y otros tipos de contenido de manera más precisa y coherente. Sin embargo, es fundamental seguir investigando y refinando estos modelos para abordar los desafíos de sesgo, precisión y ética que pueden surgir en la generación de contenido a gran escala.

¿Qué son Dall-E, ChatGPT y Bard?

Dall-E, ChatGPT y Bard son interfaces populares de inteligencia artificial generativa.

Dall-E. Entrenado con un gran conjunto de datos de imágenes y sus descripciones de texto asociadas, Dall-E es un ejemplo de una aplicación de inteligencia artificial multimodal que identifica conexiones a través de múltiples medios, como visión, texto y audio. En este caso, establece conexiones entre el significado de las palabras y los elementos visuales. Fue desarrollado utilizando la implementación GPT de OpenAI en 2021. Dall-E 2, una segunda versión más capaz, fue lanzada en 2022. Permite a los usuarios generar imágenes en múltiples estilos basándose en indicaciones proporcionadas por el usuario.

ChatGPT. El chatbot impulsado por inteligencia artificial que causó sensación en el mundo en noviembre de 2022 fue construido sobre la implementación GPT-3.5 de OpenAI. OpenAI ha proporcionado una forma de interactuar y ajustar las respuestas de texto a través de una interfaz de chat con retroalimentación interactiva. Las versiones anteriores de GPT solo eran accesibles a través de una API. GPT-4 fue lanzado el 14 de marzo de 2023. ChatGPT incorpora la historia de su conversación con un usuario en sus resultados, simulando una conversación real. Después de la increíble popularidad de la nueva interfaz de GPT, Microsoft anunció una importante inversión en OpenAI e integró una versión de GPT en su motor de búsqueda Bing.

Bard. Bard es otro ejemplo de una interfaz generativa de inteligencia artificial desarrollada por OpenAI. Se enfoca en la generación de poesía y utiliza la tecnología de lenguaje natural para crear versos y poemas a partir de indicaciones proporcionadas por los usuarios. Bard muestra cómo la inteligencia artificial generativa puede ser utilizada para fines creativos y artísticos.

Estas interfaces generativas de inteligencia artificial han ganado popularidad debido a su capacidad para generar contenido de calidad en diversos dominios, desde imágenes hasta textos y poesía. Sin embargo, es importante tener en cuenta que estas tecnologías también plantean desafíos éticos y de responsabilidad, como el sesgo y la veracidad de la información generada.

¿Cuáles son los casos de uso de la inteligencia artificial generativa?

La inteligencia artificial generativa se puede aplicar en varios casos de uso para generar virtualmente cualquier tipo de contenido. La tecnología está cada vez más accesible para usuarios de todo tipo gracias a avances innovadores como GPT, que se puede ajustar para diferentes aplicaciones. Algunos de los casos de uso de la inteligencia artificial generativa incluyen los siguientes:

  • Implementación de chatbots para servicio al cliente y soporte técnico.
  • Despliegue de deepfakes para imitar personas e incluso individuos específicos.
  • Mejora del doblaje de películas y contenido educativo en diferentes idiomas.
  • Redacción de respuestas de correo electrónico, perfiles de citas, currículos y trabajos académicos.
  • Creación de arte hiperrealista en un estilo particular.
  • Mejora de videos de demostración de productos.
  • Sugerencia de nuevos compuestos de medicamentos para probar.
  • Diseño de productos físicos y edificios.
  • Optimización de nuevos diseños de chips.
  • Composición musical en un estilo o tono específico.

Estos son solo algunos ejemplos de cómo se puede utilizar la inteligencia artificial generativa en diferentes campos. La capacidad de generar contenido creativo, adaptado y personalizado ofrece un potencial innovador en áreas como el arte, la música, la traducción, el diseño, la investigación científica y muchas más. Sin embargo, también es fundamental abordar los desafíos éticos, como el uso responsable de deepfakes y la mitigación de sesgos, para asegurar que la tecnología se utilice de manera adecuada y beneficiosa.

¿Cuáles son los beneficios de la inteligencia artificial generativa?

La inteligencia artificial generativa puede aplicarse ampliamente en muchas áreas del negocio. Puede facilitar la interpretación y comprensión del contenido existente y crear automáticamente nuevo contenido. Los desarrolladores están explorando formas en que la inteligencia artificial generativa puede mejorar los flujos de trabajo existentes, con el objetivo de adaptar los flujos de trabajo por completo para aprovechar al máximo la tecnología. Algunos de los beneficios potenciales de implementar inteligencia artificial generativa incluyen los siguientes:

  • Automatización del proceso manual de redacción de contenido.
  • Reducción del esfuerzo necesario para responder correos electrónicos.
  • Mejora en la respuesta a consultas técnicas específicas.
  • Creación de representaciones realistas de personas.
  • Resumen de información compleja en una narrativa coherente.
  • Simplificación del proceso de creación de contenido en un estilo particular.

Estos son solo algunos ejemplos de los beneficios que se pueden obtener al implementar la inteligencia artificial generativa. Al automatizar tareas, reducir la carga de trabajo y mejorar la calidad del contenido generado, esta tecnología tiene el potencial de agilizar los procesos empresariales, mejorar la productividad y liberar tiempo para enfocarse en actividades de mayor valor. Sin embargo, es importante considerar los desafíos y limitaciones asociados, como el control de calidad y la ética en la generación de contenido, para garantizar un uso responsable y efectivo de la inteligencia artificial generativa.

¿Cuáles son las limitaciones de la inteligencia artificial generativa?

Las implementaciones tempranas de la inteligencia artificial generativa ilustran vívidamente sus numerosas limitaciones. Algunos de los desafíos que presenta la inteligencia artificial generativa surgen de los enfoques específicos utilizados para implementar casos de uso particulares. Por ejemplo, un resumen de un tema complejo es más fácil de leer que una explicación que incluye diversas fuentes que respaldan los puntos clave. Sin embargo, la legibilidad del resumen se logra a expensas de que el usuario pueda verificar de dónde proviene la información.

Aquí hay algunas limitaciones a considerar al implementar o utilizar una aplicación de inteligencia artificial generativa:

  • No siempre identifica la fuente del contenido.
  • Puede resultar desafiante evaluar el sesgo de las fuentes originales.
  • El contenido que suena realista dificulta la identificación de información inexacta.
  • Puede ser difícil comprender cómo adaptarse a nuevas circunstancias.
  • Los resultados pueden pasar por alto el sesgo, los prejuicios y el odio.

Es importante tener en cuenta estas limitaciones al utilizar la inteligencia artificial generativa. Aunque la tecnología tiene muchas aplicaciones valiosas, también es fundamental ser crítico y cuidadoso al evaluar la veracidad, el sesgo y la confiabilidad del contenido generado. La transparencia y la ética en la implementación y uso de la inteligencia artificial generativa son fundamentales para garantizar resultados confiables y responsables.

¿Cuáles son las preocupaciones relacionadas con la inteligencia artificial generativa?

El surgimiento de la inteligencia artificial generativa también ha generado diversas preocupaciones. Estas se relacionan con la calidad de los resultados, el potencial de mal uso y abuso, y la posibilidad de interrumpir los modelos de negocio existentes. A continuación, se presentan algunos de los problemas específicos planteados por el estado actual de la inteligencia artificial generativa:

  • Puede proporcionar información inexacta y engañosa.
  • Es más difícil confiar en ella sin conocer la fuente y procedencia de la información.
  • Puede promover nuevos tipos de plagio que ignoran los derechos de los creadores de contenido y artistas de contenido original.
  • Podría interrumpir los modelos de negocio existentes basados en la optimización de motores de búsqueda y la publicidad.
  • Facilita la generación de noticias falsas.
  • Facilita afirmar que una evidencia fotográfica real de un acto indebido fue simplemente una falsificación generada por IA.
  • Podría suplantar a las personas para realizar ataques cibernéticos de ingeniería social más efectivos.

Estas preocupaciones son importantes y requieren una atención cuidadosa al implementar y utilizar la inteligencia artificial generativa. La veracidad y la ética son aspectos fundamentales que deben tenerse en cuenta para garantizar un uso responsable de la tecnología y mitigar los posibles efectos negativos. Además, se deben establecer marcos legales y regulaciones adecuadas para abordar los problemas relacionados con el uso inapropiado y el impacto en la sociedad y la economía.

¿Cuáles son algunos ejemplos de herramientas de inteligencia artificial generativa?

Existen herramientas de inteligencia artificial generativa para diversas modalidades, como texto, imágenes, música, código y voces. Algunas populares herramientas generadoras de contenido de IA para explorar incluyen las siguientes:

  • Herramientas de generación de texto: GPT, Jasper, AI-Writer y Lex.
  • Herramientas de generación de imágenes: Dall-E 2, Midjourney y Stable Diffusion.
  • Herramientas de generación de música: Amper, Dadabots y MuseNet.
  • Herramientas de generación de código: CodeStarter, Codex, GitHub Copilot y Tabnine.
  • Herramientas de síntesis de voz: Descript, Listnr y Podcast.ai.
  • Empresas de herramientas de diseño de chips de IA: Synopsys, Cadence, Google y Nvidia.

Estos son solo algunos ejemplos de las diversas herramientas de inteligencia artificial generativa disponibles en el mercado. Cada una de estas herramientas tiene sus propias características y capacidades únicas para generar contenido en diferentes modalidades. Es importante explorar y evaluar estas herramientas según las necesidades y objetivos específicos, teniendo en cuenta factores como la calidad de los resultados, la facilidad de uso y la adecuación para el caso de uso deseado.

Casos de uso de la inteligencia artificial generativa por industria

Las nuevas tecnologías de inteligencia artificial generativa a menudo se describen como tecnologías de propósito general, similares a la energía a vapor, la electricidad y la informática, porque pueden tener un impacto profundo en muchas industrias y casos de uso. Es importante tener en cuenta que, al igual que con las tecnologías de propósito general anteriores, a menudo lleva décadas encontrar la mejor manera de organizar los flujos de trabajo para aprovechar el nuevo enfoque en lugar de acelerar pequeñas partes de los flujos de trabajo existentes. A continuación se presentan algunas formas en las que las aplicaciones de inteligencia artificial generativa podrían impactar diferentes industrias:

  • Finanzas: pueden monitorear las transacciones en el contexto del historial de un individuo para construir mejores sistemas de detección de fraudes.
  • Firmas legales: pueden utilizar la inteligencia artificial generativa para diseñar e interpretar contratos, analizar evidencia y sugerir argumentos.
  • Fabricantes: pueden utilizar la inteligencia artificial generativa para combinar datos de cámaras, rayos X y otras métricas para identificar piezas defectuosas y las causas raíz de manera más precisa y económica.
  • Empresas de cine y medios de comunicación: pueden utilizar la inteligencia artificial generativa para producir contenido de manera más económica y traducirlo a otros idiomas con las voces originales de los actores.
  • Industria médica: puede utilizar la inteligencia artificial generativa para identificar de manera más eficiente candidatos prometedores para medicamentos.
  • Firmas de arquitectura: pueden utilizar la inteligencia artificial generativa para diseñar y adaptar prototipos de manera más rápida.
  • Empresas de videojuegos: pueden utilizar la inteligencia artificial generativa para diseñar contenido y niveles de juego.

Estos son solo algunos ejemplos de cómo las aplicaciones de inteligencia artificial generativa pueden tener un impacto en diferentes industrias. Con el uso adecuado de esta tecnología, las organizaciones pueden mejorar la eficiencia, la calidad y la creatividad en diversos procesos y servicios. Sin embargo, es importante tener en cuenta los desafíos y las consideraciones éticas específicas de cada industria para garantizar un uso responsable y beneficioso de la inteligencia artificial generativa.

Ética y sesgos en la inteligencia artificial generativa

A pesar de sus promesas, las nuevas herramientas de inteligencia artificial generativa abren un sinfín de cuestiones en cuanto a precisión, confiabilidad, sesgos, alucinaciones y plagio; problemas éticos que probablemente tomarán años en resolverse. Ninguno de estos problemas es particularmente nuevo en el ámbito de la inteligencia artificial. Por ejemplo, la primera incursión de Microsoft en chatbots en 2016, llamada Tay, tuvo que ser apagada después de comenzar a propagar retórica inflamatoria en Twitter.

Lo nuevo es que las últimas aplicaciones de inteligencia artificial generativa suenan más coherentes superficialmente. Sin embargo, esta combinación de lenguaje similar al humano y coherencia no es sinónimo de inteligencia humana, y actualmente hay un gran debate sobre si los modelos de inteligencia artificial generativa pueden ser entrenados para tener capacidad de razonamiento. Incluso, un ingeniero de Google fue despedido después de declarar públicamente que la aplicación de inteligencia artificial generativa de la compañía, Language Models for Dialog Applications (LaMDA), era consciente.

El realismo convincente del contenido generado por la inteligencia artificial generativa introduce un nuevo conjunto de riesgos de IA. Dificulta la detección de contenido generado por IA y, lo que es más importante, dificulta la detección de cuándo las cosas están mal. Esto puede ser un gran problema cuando confiamos en los resultados generados por la inteligencia artificial generativa para escribir código o brindar consejos médicos. Muchos de los resultados de la inteligencia artificial generativa no son transparentes, por lo que es difícil determinar, por ejemplo, si infringen los derechos de autor o si hay algún problema con las fuentes originales de las que obtienen los resultados. Si no se sabe cómo llegó la IA a una conclusión, no se puede razonar sobre por qué podría estar equivocada.

Es fundamental abordar estos desafíos éticos y de sesgos en la inteligencia artificial generativa. Se requiere una supervisión y regulación adecuadas para garantizar la transparencia, responsabilidad y confiabilidad en el desarrollo y uso de estas tecnologías. También se deben tomar medidas para mitigar los sesgos inherentes y garantizar una utilización responsable y ética de la inteligencia artificial generativa. Esto implica el establecimiento de prácticas de desarrollo responsables, evaluaciones de impacto ético y el fomento de la diversidad y la inclusión en los conjuntos de datos utilizados para entrenar estos modelos.

Inteligencia Artificial Generativa vs. IA

La inteligencia artificial generativa produce nuevo contenido, respuestas de chat, diseños, datos sintéticos o deepfakes. Por otro lado, la inteligencia artificial tradicional se ha enfocado en detectar patrones, tomar decisiones, perfeccionar análisis, clasificar datos y detectar fraudes.

La inteligencia artificial generativa, como se mencionó anteriormente, utiliza con frecuencia técnicas de redes neuronales como transformers, GANs y VAEs. Por otro lado, otros tipos de inteligencia artificial utilizan técnicas que incluyen redes neuronales convolucionales, redes neuronales recurrentes y aprendizaje por refuerzo.

La inteligencia artificial generativa a menudo comienza con una indicación que permite que un usuario o una fuente de datos envíe una consulta inicial o un conjunto de datos para guiar la generación de contenido. Esto puede ser un proceso iterativo para explorar variaciones de contenido. Por otro lado, los algoritmos de inteligencia artificial tradicional procesan nuevos datos para devolver un resultado simple.

Ambos enfoques tienen aplicaciones y beneficios distintos. Mientras que la inteligencia artificial tradicional se centra en el análisis y la toma de decisiones basada en datos existentes, la inteligencia artificial generativa se destaca por su capacidad de crear nuevo contenido de manera autónoma. Ambos campos continúan evolucionando y se complementan entre sí en muchos casos, lo que permite un amplio rango de aplicaciones en diferentes industrias.