Esteu interessats en ells GRATU .T? Estalvia amb els nostres cupons activats QUÈ TAL o TELEGRAMA!

Llama 3 desafia els gegants: aquí teniu el nou model d'IA de Meta

18 2024 abril

Meta n'ha afegit dos de nous models lingüístics a la seva sèrie: Llama 3 8B e Llama 3 70B. Aquests prometen un rendiment superior al món de la intel·ligència artificial. La notícia més impactant? La presència de 8 mil milions i 70 mil milions de paràmetres respectivament. Aquests nombres representen la complexitat i la capacitat del model per manejar i processar informazioni.

Llama 3 no són només dos models: hi ha més material en camí

Meta no s'atura aquí; planeja llançar més models a la sèrie Llama 3, però sense especificar data. Aquesta estratègia crea expectació i també demostra el compromís de la companyia per millorar contínuament la seva oferta.

I nous models de Llama es descriuen com un salt dels models anteriors. Aquesta millora es deu en part a l'ús de dos clústers de GPU personalitzats, amb 24.000 unitats cadascuna, la qual cosa va permetre entrenar models amb més eficàcia i precisió. Meta afirma que, pel nombre de paràmetres que posseeixen, aquests models ho són entre els millors disponibles avui per a la intel·ligència artificial generativa.

El rendiment de Llama 3 es va mesurar mitjançant diversos punts de referència d'IA, que són proves estandarditzades que s'utilitzen per avaluar les capacitats dels models d'IA. Això inclou MMLU pel coneixement, ARC per a l'adquisició d'habilitats, p DROP per raonar sobre blocs de text. Tot i que hi ha opinions diferents sobre la utilitat d'aquests punts de referència, segueixen sent un mètode comú per avaluar i comparar les capacitats dels models d'IA.

En particular, Llama 3 8B va superar models similars de codi obert amb menys paràmetres, com ara Mistral i Google Gemma, en almenys nou punts de referència diferents. Això inclou proves sobre coneixements generals, raonament i habilitats específiques en àrees com la biologia, la física, la química i fins i tot problemes de generació de codi i matemàtiques. Cosa que GPT-4, per exemple, no pot fer-ho molt bé.

El model més gran, Llama 3 70B, no només competeix sinó que en alguns casos supera els models insígnia com ara Gemini 1.5 Pro de Google en diverses proves, demostrant que malgrat la forta competència, pot plantar cara fins i tot als gegants del sector. Tanmateix, és important tenir en compte que, tot i que supera alguns models emblemàtics com ara Claude 3 Sonet d'Anthropic en diverses proves, no arriba al rendiment del model Claude 3 Opus més avançat.