Entendiendo ChatGPT: Funcionamiento, componentes clave y retos actuales de los Modelos de Lenguaje a Gran Escala
OpenAI es una compañía cuya actividad principal es la investigación en temas relacionados con la inteligencia artificial. En noviembre de 2022 lanzó un sistema conversacional conocido como ChatGPT. Este sistema causó un enorme revuelo mediático que puso en el foco los últimos desarrollos en materia de procesado del lenguaje natural, principalmente los grandes modelos de lenguaje o Large Language Models (LLM). Estos modelos que se desarrollan mediante técnicas de aprendizaje profundo o Deep Learning pertenecen al ámbito de la Inteligencia Artificial Generativa (Generative AI) y son capaces de realizar, con grandes prestaciones, tareas avanzadas de procesado de lenguaje natural como la generación de textos con de gran calidad (práctimente indistinguibles de los generados por un humano), la clasificación de textos, el resumen de documentos, la traducción automática entre idiomas, etc., pero también son capaces de generar imágenes, audio o video.
El objetivo de este contenido es ofrecer una descripción relativamente simple y accesible, tanto de ChatGPT en particular, como de los modelos de lenguaje a gran escala en general capaz de permitir a un lector no experto en este tipo de tecnologías comprender sus principios de funcionamiento, sus fortalezas, sus debilidades, sus retos y sus posibilidades.
Intermedio, dirigido a personas interesadas en la tecnología, pero sin necesidad de conocimientos previos sobre el aprendizaje automático o la inteligencia artificial.
- Introducción a ChatGPT y a los grandes modelos de lenguaje (LLM)
- Principios de funcionamiento de los grandes modelos de lenguaje
- Cartografía actual y evolución de los grandes modelos de lenguaje
- Capacidades y casos de uso de los LLM.