3 70B, que promete ofrecer un rendimiento similar al de su modelo más grande, Llama 3.1 405B, pero a un costo más bajo.
Según Ahmad Al-Dahle, vicepresidente de IA generativa en Meta, "al aprovechar los últimos avances en técnicas de post-entrenamiento, este modelo mejora el rendimiento básico a un costo significativamente menor". Para demostrar esto, Al-Dahle publicó un gráfico que muestra cómo Llama 3.3 70B supera a otros modelos de IA, como Gemini 1.5 Pro de Google, GPT-4o de OpenAI y Nova Pro de Amazon, en varios benchmarks de la industria.
Entre los beneficios de Llama 3.3 70B se encuentran mejoras en áreas como las matemáticas, el conocimiento general, el seguimiento de instrucciones y el uso de aplicaciones. Además, el modelo está disponible para descargar en la plataforma de desarrollo de IA Hugging Face y en otros sitios, incluyendo el sitio web oficial de Llama.
Meta ha estado trabajando para dominar el campo de la IA con modelos "abiertos" que pueden ser utilizados y comercializados para una variedad de aplicaciones. Sin embargo, sus términos y condiciones limitan cómo ciertos desarrolladores pueden utilizar los modelos de Llama. A pesar de esto, Llama ha logrado más de 650 millones de descargas, según Meta.
La empresa también ha utilizado Llama internamente. Meta AI, el asistente de IA de la empresa, que se basa completamente en modelos de Llama, tiene casi 600 millones de usuarios activos mensuales, según el CEO de Meta, Mark Zuckerberg. Zuckerberg afirma que Meta AI está en camino de convertirse en el asistente de IA más utilizado en el mundo.
La naturaleza "abierta" de Llama ha sido una bendición y una maldición para Meta. En noviembre, un informe alegó que investigadores militares chinos habían utilizado un modelo de Llama para desarrollar un chatbot de defensa. Meta respondió haciendo que sus modelos de Llama estuvieran disponibles para contratistas de defensa de EE. UU.
La empresa también ha expresado preocupaciones sobre su capacidad para cumplir con la Ley de IA de la UE, que establece un marco regulatorio para la IA. Meta ha llamado a la implementación de la ley "demasiado impredecible" para su estrategia de lanzamiento abierto.
Un tema relacionado para la empresa son las disposiciones del Reglamento General de Protección de Datos (RGPD) de la UE, relacionadas con el entrenamiento de IA. Meta entrena modelos de IA con datos públicos de usuarios de Instagram y Facebook que no han optado por no participar, datos que en Europa están sujetos a garantías del RGPD.
Los reguladores de la UE solicitaron a Meta que detuviera el entrenamiento en datos de usuarios europeos mientras evaluaban el cumplimiento de la empresa con el RGPD. Meta accedió, al mismo tiempo que respaldó una carta abierta que pedía "una interpretación moderna" del RGPD que no "rechace el progreso".
Meta no es inmune a los desafíos técnicos que otros laboratorios de IA están enfrentando. La empresa está ampliando su infraestructura de cómputo para entrenar y servir futuras generaciones de Llama. La empresa anunció que construirá un centro de datos de IA de $10 mil millones en Luisiana, el centro de datos de IA más grande que Meta haya construido.
Zuckerberg dijo en la llamada de ganancias del Q4 de Meta en agosto que para entrenar la próxima generación de modelos de Llama, Llama 4, la empresa necesitará 10 veces más cómputo que lo que se necesitó para entrenar Llama 3. Meta ha adquirido un cluster de más de 100.000 GPUs de Nvidia para el desarrollo de modelos, rivalizando con los recursos de la competencia como xAI.
El entrenamiento de modelos de