Gamal Serhan – El fascinante camino de la Inteligencia Artificial

Hace unos dos años, la irrupción de ChatGPT-3 en el mundo de la inteligencia artificial marcó un punto de inflexión comparable a la toma de la Bastilla en la Revolución Francesa. Fue el acontecimiento simbólico que representaba el fin de una era y el inicio de una nueva.

Aunque pueda parecer un concepto reciente, la inteligencia artificial tiene una larga historia. En 1950, Alan Turing publicó un artículo titulado “Computing machinery and inteligence” en el que se planteaba por primera vez la posibilidad de una máquina pudiera pensar.

Pero no es hasta la década de los noventa que realmente se puede lograr avances significativos sobre su desarrollo con la creación de una maquina llamada LeNet; una red neuronal convolucional para reconocimiento de patrones, que fue entrenada para el reconocimiento de imágenes y solo logro tener una eficiencia del 25%.

En 2010, surge la idea de emplear procesadores de videojuegos (CPU) para entrenar redes neuronales, aprovechando la lógica multidimensional de estos procesadores fabricados por NVIDIA, logrando reducir el tiempo de respuesta de meses a horas y en el año 2013 la Universidad de Toronto publica un articulo en el cual afirma que ha logrado que una maquina similar a LeNet, tenga una eficiencia del 98%.

El año 2014, se llevó a cabo una competencia llamada el Test o la Prueba de Turing, en la cual un robot tenia que convencer a un jurado que era humano durante una sesión de 5 minutos de conversación, logrando convencer a un tercio de los jueces del concurso.

Las Big Tech, que no querían quedar fuera de esta revolución, avanzaban con mucha prudencia en el uso de la inteligencia artificial en sus diferentes modelos de negocios, temerosos fundamentalmente por las demandas que podían enfrentar de todas partes.

Mientras, Elon Musk, Sam Altman y otros socios más, al darse cuenta de su importancia decidieron crear una empresa sin ánimo de lucro (OpenAI), para desarrollar la inteligencia artificial como código libre y que esté al alcance de toda la humanidad.

En 2017 Google Research publica «Attention is All You Need» en el que describe un modelo de aprendizaje profundo revolucionario llamado Transformer (con miles de millones de neuronas) – IAG (Texto, Imágenes y Videos). Este modelo enfocado en la “atención” en diferentes partes de la entrada, era suficiente para lograr un rendimiento superior en tareas de procesamiento de lenguaje natural (NLP), eliminando la necesidad de redes recurrentes y convolucionales tradicionales, allanó el camino para la creación de modelos de lenguaje de gran escala.

Al siguiente año OpenAI presentó GPT-2 (Generative Pre-trained Transformer-2), un modelo generativo que podía escribir ensayos, responder preguntas y generar contenido, el problema es que el algoritmo seleccionaba la respuesta de más alta probabilidad estadística y generaba un texto aburrido NO HUMANO.

Dos años después, OpenAI lanzó una versión mejorada, GPT-3, que fue entrenada con dos millones de libros digitales y más de cien millones de palabras de Internet, utilizando 175 mil millones de parámetros. Su lanzamiento aceleró la investigación en modelos de lenguaje de gran escala y sentó las bases para aplicaciones más avanzadas de IA en el procesamiento del lenguaje natural.

ChatGPT-3, era capaz de producir texto, código y poesía con una calidad excepcionalmente similar a la humana, porque a alguien se le ocurrió que en vez de elegir la respuesta de más alta probabilidad debería “jugar” con las posibles respuestas, agregándole temperatura. Contesta extraordinariamente bien, pero dependiendo de la “temperatura” puede alucinar en sus respuestas.

Nunca hay que olvidar que es una maquina alimentada con miles de millones de parámetros, pero es una maquina que NO es inteligente y que simplemente procesa toda la información que tiene a una velocidad impresionante (dependiendo del modelo de lenguaje) y que responde sobre entrelazando información que le puede parecer coherente a cualquier humano; y eso da la sensación de creación, pero que puede ser incorrecta.

Entonces para restringir sus alucinaciones se crearon los “prompts” o las instrucciones que le permiten acotar el contexto, el objetivo y la instrucción, y regular la temperatura defiendo el grado de creatividad o precisión que queremos en una respuesta.

Indudablemente, podríamos dividir la historia en ‘a.I.A.’ (antes de la Inteligencia Artificial) y ‘d.I.A.’ (después de la Inteligencia Artificial), ya que esta tecnología representa una herramienta con potencial disruptivo para transformar vidas, negocios y sociedades enteras.

Gamal Serhan Jaldin (@gamalbolivia)