És la notícia del moment. Google acaba de llançar la seva resposta al ChatGPT d'OpenAI, tan esperada per tot el món. L'assaig fallit de Bard no ho explicarem. L'invent es diu Bessons i és, segons els desenvolupadors, el model d'intel·ligència artificial més potent mai creat. Paraules que desperten molta expectació i il·lusió, encara que també una mica de vertigen.
Els més entusiastes ja parlen duna nova era. La «Era de Gemini«. El gegant tecnològic assegura que aquest model d'intel·ligència artificial serà totalment disruptor. Entre altres coses, ha estat capacitat per reconèixer, comprendre i combinar diferents tipus dinformació: text, imatges, àudio, vídeo i fins i tot codi.
Exagerat? No, si prenem com a certes les recents declaracions del director executiu de Google DeepMind, Demis Hassabis. Ell afirma que Gemini posseeix una intel·ligència superior a qualsevol cervell humà en cinquanta àrees temàtiques diferents. Això es dedueix, pel que sembla, de les proves prèvies que s'han fet durant les últimes setmanes.
Gemini també disposarà d'habilitats de programació avançades. En això s'inclou la generació de codi d'alta qualitat mitjançant un sistema avançat anomenat AlphaCode 2. També podreu resoldre problemes de programació complexos i assistir el treball dels desenvolupadors.
En tot cas, a Europa haurem d'esperar una mica per comprovar si tot això és cert, ja que Google Gemini no estarà disponible als estats membres de la UE a causa dels actuals obstacles regulatoris. Quant de temps caldrà esperar? Sembla que no gaire, la veritat, ja que ja s'està treballant en una legislació específica europea, (l'anomenada Llei IA) per regular el desenvolupament i limpacte daquesta nova tecnologia.
Els 3 models de la família Gemini de Google
Arran del que Google va explicar durant en esdeveniment de presentació de Gemini, sembla que ens trobarem amb tres models diferents. Són aquests:
- Gemini Ultra, que serà el més gran de tot, destinat a la realització de tasques complexes.
- Gemini Pro, pensat per dur a terme una gamma més àmplia de tasques amb un nivell òptim de rendiment.
- Nan Bessons, per utilitzar en dispositius mòbils.
La veritat és que és molt el que s'ha dit de Gemini, encara que Google s'ha guardat molt d'aprofundir massa els detalls. Sabem, per exemple, que Google diu que per a la seva creació i durant la fase de proves s'han fet servir les grans Unitats de Processament Tensor (TPU) v4 i v5e internes de la companyia. L'artilleria feixuga, per dir-ho d'alguna manera.
Una de les notícies més impactants d´aquesta eina d´intel·ligència artificial és l´elaboració d´un instrument (Gemini Nano) que permetrà als desenvolupadors crear aplicacions d´IA sense necessitat de comptar amb una connexió a internet, és a dir, amb una garantia addicional de privadesa .
D'altra banda, tot indica que Gemini Pro estarà disponible per a desenvolupadors i clients empresarials de Google aquest mateix mes.
Provar Gemini a través de Bard
Els usuaris dels Estats Units ja poden provar el nou model d'IA a través de una versió ajustada de Gemini Pro que ha estat implementada al chatbot de Google. Parlem de Bard, que va veure la llum el març d'aquest any i que va ser etiquetat com un veritable fracàs. Ara, gràcies a Gemini, hi arriba una segona oportunitat.
De fet, a Google parlen d'una actualització de Bard, la més ambiciosa que hagi tingut lloc des del llançament, que pot servir com a porta d'entrada a Gemini per a molts usuaris. Estarà disponible en anglès a més de 170 països i territoris de tot el món. Ja hem explicat que els ciutadans de la Unió Europea haurem de ser una mica més pacients, què se li farà.
La veritat és que tot l'univers Google està experimentant una transformació espectacular gràcies a la introducció de Gemini. Per exemple, una versió més modesta de l'eina ja s'està implementant al vaixell insígnia dels dispositius mòbils de Google, el telèfon intel·ligent Pixel 8 Pro. D'altra banda, es preveu que a curt termini també pugui arribar a ser present en altres productes i serveis de Google com Search, Ads i Chrome.
A més d'això, Google també va anunciar al mateix esdeveniment l'arribada de Cloud TPU v5p, un accelerador d'IA d'última generació dissenyat específicament per entrenar models d'intel·ligència artificial d'avantguarda. I el pas final, es podria dir definitiu, serà l'aterratge de Gemini al cercador de Google. El seu paper serà alimentar el seu principal motor de cerca web i convertir el procés en una experiència generativa. Això és una cosa que viurem.
En resum, estem davant d'una eina «més potent que Chat00GPT», segons els seus creadors, que arriba amb la intenció de canviar el nostre món. Tot esperant noves notícies i de conèixer més d'aquesta apassionant tecnologia, et deixem un petit aperitiu en forma de vídeo: