
L'última innovació de Google en el camp de la intel·ligència artificial ha debutat avui per sorpresa, malgrat els informes que ho faria ajornat al 2024. Aquest model de llenguatge, nascut a l'ombra de ChatGPT, es presenta com a avenç en el panorama tecnològic. Amb funcions d'avantguarda i promeses d'integracions revolucionàries, sens dubte es parlarà de Gemini. Això és el que Google va dir sobre el nou model d'idioma.
Característiques de Gemini, la resposta ambiciosa de Google a OpenAI
Bessons es presenta en tres variants: Nano, Pro e Ultra, cadascun dissenyat per a finalitats específiques. Aquesta diversificació demostra la versatilitat i l'ambició de Google per fer que la IA sigui accessible per a tothom.
- Gemini Nano és una versió més lleugera, ideal per a ús offline en dispositius Android com el Google Pixel 8 Pro
- Gemini Pro, més robust, està pensat per a millorar els serveis d'IA de Google, inclòs Bard
- Està dissenyat Gemini Ultra, el més potent dels tres per a centres de dades i aplicacions empresarials

Una de les característiques més interessants de Gemini és la seva capacitat multimodal. A diferència d'altres models que se centren només en el text, Gemini pot entendre i interactuar amb vídeo i àudio. Una mica com va començar a fer ChatGPT fa uns mesos. Aquest enfocament integrat promet revolucionar la manera com interactuem amb la tecnologia, obrint noves fronteres en l'aprenentatge automàtic.
Segons la informació facilitada per Google, a més de les seves capacitats, el model lingüístic brilla per l'eficiència. Entrenat a Unitats de processament de tensors de Google, ofereix un rendiment superior a un cost reduït. Amb la introducció de TPU v5p, Google pretén millorar encara més l'eficiència en l'entrenament i l'execució de models a gran escala.
Gemini Nano marca el debut de Google en el sector dels dispositius mòbils, promet portar funcions avançades d'IA als principals telèfons intel·ligents Android, com ara el Pixel 8 Pro. No hi haurà una aplicació dedicada per accedir a Nano, però Google té la intenció integrar-lo a les funcions existents com un resum a l'aplicació Recorder i una resposta intel·ligent a Gboard per a WhatsApp. Gràcies a la plataforma AICore, els desenvolupadors podran aprofitar Gemini Nano, obrint el camí per a noves aplicacions interessants.
Pujant de nivell, trobem Gemini Pro, disponible per a desenvolupadors i clients empresarials a partir del 13 de desembre mitjançant la nova API de Google AI Studio o Google Cloud Vertex AI. Google Bard, una plataforma per a indicacions basades en text, ja aprofita Gemini Pro, amb plans per ampliar el suport a altres modes. Actualment disponible a 170 països, Google té previst fer-ho expandeix Bard amb el model Pro a més regions i idiomes.
Passant a Gemini Ultra, ens trobem davant del model més emocionant de tots. Tanmateix, haurem d'esperar una mica més abans de poder-lo utilitzar, com ho és Google realitzant controls rigorosos de seguretat i fiabilitat. Ultra estarà disponible inicialment per a un grup selecte de clients, desenvolupadors i socis per obtenir comentaris preliminars, abans de ser llançat a desenvolupadors i clients empresarials a principis de l'any vinent. Aquest model també ho és previst per integrar-se en una nova experiència Bard avançada.
Pel que fa al rendiment, Google Gemini ha aconseguit resultats impressionants, superant el 90% a la prova MMLU i superant els models d'IA existents en nombroses proves acadèmiques. Tot i que Gemini Pro supera GPT-3.5, al seu torn és superat per GPT-4, mentre que Ultra té un avantatge marginal sobre GPT-4. Això situa el model de Google en una posició competitiva en el camp de la IA.
Pel que fa a la seguretat, Google afirma que Gemini es va desenvolupar amb un fort èmfasi responsabilitat i sobre seguretat, tot i que queden preguntes obertes sobre el seu impacte en la privadesa, l'ètica i l'ocupació.