viernes 22 de noviembre de 2024 5:11 pm
Eddy Tolentino

El modelo de IA se quiere convertir en una referencia para desarrolladores e investigadores.
Su tamaño es cuatro veces el de Llama 2, pero la empresa no ha ofrecido los datos de entrenamiento.

Hace unos días Elon Musk publicó un tuit asegurando que en esa semana Grok se publicaría como Open Source. Ayer, justo cuando acababa el plazo, se cumplía la promesa y el código y datos relacionados con Grok ya son públicos y Open Source.

Gracias a este lanzamiento los desarrolladores e investigadores contarán con una nueva opción a la hora de trabajar con modelos de inteligencia artificial. Los referentes claros en investigación hasta ahora eran Mixtral (de la startup francesa Mistral AI) y sobre todo Llama 2, el LLM de Meta.

Este último modelo es gratuito para investigar, pero hay limitaciones a la hora de usarlo comercialmente y los desarrolladores deben pagar una comisión para usos masivos. Esto es, aquellos en los que se producen más de 700 millones de usuarios diarios.

Pero aquí Grok desaca por un apartado fundamental, que no es otro que su tamaño. Es gigantesco. Como indican los responsables de xAI en su entrada en el blog oficial, esta liberación del proyecto es la de un modelo 314B, es decir, con 314.000 millones de parámetros.

Teniendo en cuenta que Llama 2 dispone de 65.000 millones de parámetros, Grok es casi cuatro veces más grande, lo que teóricamente le puede dar ventajas en cuanto a la precisión de sus respuestas e interacción.

Este proyecto está disponible tanto con su código —en GitHub— como en sus “pesos” (weights), que son algo así como las sinapsis del cerebro humano, y que se ofrecen como un gigantesco fichero de cientos de GB disponible a través de un enlace magnet. La licencia utilizada es la Apache 2.0 que permite un uso comercial.

Hay un elemento ausente en el proyecto: los datos usados para entrenar el modelo, algo que permitiría analizar y pulir aún mejor el comportamiento del modelo para distintos escenarios.

Cuando Elon Musk anunció el lanzamiento de Grok, lo hizo indicando que solo los suscriptores de X podrían utilizarlo. Los primeros análisis indicaron que el comportamento del modelo no era superior a ChatGPT, y lo único que lo diferenciaba era el tono sarcástico con el que Grok contestaba en su interacción de texto con los usuarios.

Javier Pastor

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *