Google a dezvăluit pe 6 decembrie, în orașul natal, noul său sistem de inteligență artificială îmbunătățit, numit “Gemini”. Caracteristica principală a acestuia este îmbunătățirea capacității de procesare multimodală, permitând luarea deciziilor bazate pe informații variate precum text, voce, imagini, video și cod. Cu toate acestea, descrierile textuale tind să nu transmită cu adevărat extraordinara complexitate a lui “Gemini”, lăsând privitorii să se gândească, la nivelul de doar “interesant”.
Google a luat măsuri pentru a remedia această situație, publicând un videoclip pe YouTube care evidențiază cu adevărat capabilitățile remarcabile ale “Gemini”. Cu o durată de aproximativ 6 minute, videoclipul prezintă interacțiuni cu “Gemini” prin intermediul vocii. Utilizatorul îi arată desene și obiecte realizate manual prin intermediul camerei, prezintă videoclipuri, iar “Gemini” răspunde în mod coerent.
Din videoclip devine evident că am ajuns la un punct în care întrebarea “Nu este “Gemini” de fapt o persoană care face judecăți instantanee în spatele cortinei AI?” devine legitima, deoarece sistemul analizează în timp real ceea ce încearcă utilizatorul să transmită, permițând conversații naturale și fluență. Aceasta este o diferență semnificativă față de modul în care AI-ul actual răspunde după o perioadă de gândire atunci când i se adresează o comandă (desigur, nu putem garanta că fiecare utilizator va putea realiza acest lucru la aceeași viteză, dar aceasta este direcția în care se îndreaptă).
Videoclipul începe prin a desena o curbă și judecarea acesteia ca fiind o “curbă fără nereguli”. Apoi, prin adăugarea de linii, se începe să recunoască că este vorba despre un rață. Urmează momente în care utilizatorul îi arată materialul pentru o jucărie de rață, primește întrebări pe baza unui quiz cu hărți și amestecă hârtii într-un pahar pentru a vedea în care se află o bucată ascunsă.
În plus, “Gemini” poate identifica elemente comune atunci când i se arată mai multe obiecte, poate genera idei pentru creații de pluș folosind un fir de lână colorat și poate face comparații rapide între desene rudimentare și decide care este mai bun, chiar și atunci când provin de la oameni necalificați. “Gemini” este capabilă să vadă imaginea de ansamblu în situații complexe precum reprezentarea grafică a muzicii, conexiuni între puncte și linii pentru a identifica constelații.
Pe măsură ce încheiem anul 2023, marcând anul de vârf pentru tehnologiile AI precum ChatGPT și Stable Diffusion, ne putem aștepta la evoluții semnificative în domeniul inteligenței artificiale în 2024.
Întrebări frecvente:
- “Este Gemini mai bun decât alte AI precum ChatGPT?”
- Gemini reprezintă un avans semnificativ, fiind capabil să înțeleagă și să răspundă în timp real la diverse informații multimedia.
- “Este Gemini disponibil publicului larg?”
- Până în prezent, Google nu a făcut o declarație oficială cu privire la lansarea publică a lui Gemini. Momentan, este prezentat doar în demonstrații.
- “Cum se evidențiază Gemini în comparație cu alte sisteme AI?”
- Gemini se remarcă prin capacitățile sale de procesare multimodală, permițându-i să lucreze cu informații din diferite formate.
- “Care este viitorul tehnologiei Gemini?”
- Deși nu avem detaliile exacte, perspectivele pentru Gemini sunt promițătoare, indicând o direcție către inteligența artificială mai avansată.
- “Ce ne poate spune Gemini despre evoluția inteligenței artificiale?”
- Demonstrarea lui Gemini sugerează că viitorul AI-ului implică o abordare mai holistică și integrată a diferitelor tipuri de date.