Google ka lëshuar një model të Inteligjencës Artificiale (AI) – Gemini – për të cilin pretendon se ka “aftësi të avancuara”. Bëhet fjalë për një platformë që thuhet se u testua për zgjidhjen e shumë problemeve në disa fusha, përfshirë matematikën dhe shkencat humane. Dhe në prezantimin e tij, shefi i Google, Sundar Pichai tha se përfaqësonte një “epokë të re” për AI.
Por çfarë është Gemini?
Sipas mediave të huaja, Gemini është një model i ri dhe i fuqishëm i inteligjencës artificiale nga Google që mund të kuptojë jo vetëm tekstin, por edhe imazhet, videot dhe audion.
Si një model multimodal, Gemini përshkruhet si i aftë për të kryer detyra komplekse në matematikë, fizikë dhe fusha të tjera, si dhe për të kuptuar dhe gjeneruar kode me cilësi të lartë në gjuhë të ndryshme programimi.
Aktualisht është i disponueshëm përmes integrimeve me Google Bard dhe Google Pixel 8 dhe gradualisht do të shpaloset në shërbime të tjera të Google.
“Gemini është rezultat i përpjekjeve bashkëpunuese në shkallë të gjerë nga ekipet në të gjithë Google, duke përfshirë kolegët tanë në Google Research”, ka thënë Dennis Hassabis, CEO dhe bashkëthemelues i Google DeepMind.
“Ai u ndërtua nga themeli për të qenë multimodal, që do të thotë se mund të përgjithësojë dhe të kuptojë pa probleme, të funksionojë dhe të kombinojë lloje të ndryshme informacioni duke përfshirë tekstin, kodin, audion, imazhin dhe videon”.
Kush e krijoi Gemini?
Gemini u krijua nga Google dhe Alphabet, kompania mëmë e Google, dhe u lëshua si modeli më i avancuar i kompanisë deri më sot. Google DeepMind dha gjithashtu një kontribut të rëndësishëm në zhvillimin e Gemini.
A ka versione të ndryshme të Gemini?
Google e përshkruan Gemini si një model fleksibël që është i aftë të funksionojë në çdo gjë, nga qendrat e të dhënave të Google deri te pajisjet celulare.
Për të arritur këtë shkallë, Gemini po lëshohet në tri modalitete: Gemini Nano, Gemini Pro dhe Gemini Ultra.
Gemini Nano: Versioni Gemini Nano është krijuar për t’u ekzekutuar në telefonat inteligjentë, veçanërisht në Google Pixel 8. Ai është krijuar për të kryer detyra në pajisje që kërkojnë përpunim efikas të AI pa u lidhur me serverë të jashtëm, si për shembull, sugjerimi i përgjigjeve brenda aplikacioneve të bisedës ose përmbledhja e tekstit.
Gemini Pro: Duke funksionuar në qendrat e të dhënave të Google, Gemini Pro është krijuar për të fuqizuar versionin më të fundit të chatbotit të AI të kompanisë, Bard. Ky version është i aftë të japë përgjigje të shpejta dhe të kuptojë pyetje komplekse.
Gemini Ultra: Megjithëse ende i padisponueshëm për përdorim të gjerë, Google e përshkruan Gemini Ultra si modelin e tij më të aftë, duke tejkaluar “rezultatet aktuale të nivelit të lartë në 30 nga 32 standardet akademike të përdorura gjerësisht në kërkimin e modelit L.L.M.”. Ai thuhet se është projektuar për detyra shumë komplekse dhe është vendosur të dalë pas përfundimit të fazës aktuale të testimit.
Si mund të keni qasje në Gemini?
Gemini tani është i disponueshëm në produktet e Google në versionet e tij Nano dhe Pro, si telefoni Pixel 8 dhe chatbot Bard, përkatësisht. Dhe Google planifikon të integrojë Gemini me kalimin e kohës në Search, Ads, Chrome dhe shërbime të tjera. Zhvilluesit dhe klientët e ndërmarrjeve do të jenë në gjendje të hyjnë në Gemini Pro nëpërmjet Gemini API në AI Studio të Google dhe Google Cloud Vertex AI duke filluar nga 13 dhjetori.
Si ndryshon Gemini nga modelet e tjera të AI, si GPT-4?
Modeli i ri Gemini i Google duket të jetë një nga modelet më të mëdha, më të avancuara të AI deri më sot, megjithëse lëshimi i modelit Ultra do të jetë ai që do ta përcaktojë me siguri këtë.
Megjithatë, krahasuar me modelet e tjera të njohura që fuqizojnë chatbot me AI tani, Gemini dallohet për shkak të karakteristikës së tij multimodale, ndërsa modelet e tjera, si GPT-4, mbështeten në shtojcat dhe integrimet për të qenë vërtet multimodale, thuhet në shkrimin e ZDNET.
Më i mirë, më i shpejtë?
Modeli më i fuqishëm i OpenAI, GPT-4, shihet si standardi i artë i industrisë. Ndërsa Google mburrej se Gemini tejkalon modelin e mëparshëm të OpenAI, GPT 3.5, drejtuesit e kompanisë shmangën pyetjet se sa larg modeli e kalon GPT-4.
Por firma thekson një pikë referimi në veçanti, të quajtur MMLU (kuptim masiv i gjuhës me shumë detyra). Ky është një grup testesh të krijuara për të matur performancën e modeleve në detyrat që përfshijnë tekst dhe imazhe, duke përfshirë kuptimin e leximit, matematikën dhe kuize me zgjedhje të shumëfishta në fizikë, ekonomi dhe shkenca sociale.
Në pyetjet vetëm me tekst, Gemini thuhet se “godet” 90% dhe ekspertët njerëzorë shënojnë afërsisht 89%, thotë Pichai. GPT-4 shënon 86% në këto lloj pyetjesh.
Ndërsa në pyetjet multimodale, Gemini arrin 59%, ndërsa GPT-4 57%.
“Është modeli i parë që e kapërcen atë prag”, pretendon Pichai.
Veç tij, një mendim të mirë ka edhe ekspertja Melanie Mitchell. Performanca e Gemini ndaj grupeve të të dhënave standarde është shumë mbresëlënëse, thotë Mitchell, një studiuese e inteligjencës artificiale në Institutin Santa Fe në New Mexico.
“Është e qartë se Gemini është një sistem shumë i sofistikuar i AI. Por nuk është e qartë për mua që është në fakt shumë më i aftë se GPT-4″, shton ajo.