Modeli i madh gjuhësor i kalibruar me kujdes i Emirateve
Ka vetëm një numër të caktuar mënyrash për të çiftuar një shkronjë dhe një shifër: 260, në fakt. Pra, sipas konventës së emërtimit për modelet e inteligjencës artificiale (IA) të krijuara nga OpenAI, një nga dritat udhëheqëse të industrisë, një përplasje ishte e pashmangshme. Dhe këtë muaj, Emiratet e Bashkuara Arabe (EBA) u bënë vendi i dytë që lansuan një model të madh gjuhësor të quajtur K2, pas modelit Kimi K2 të Kinës.
K2 Think, siç quhet modeli më i ri, është një sistem efikas i IA-së. Si një model arsyetimi, si O1 i OpenAI dhe R1 i DeepSeek, ai i zgjidh problemet hap pas hapi dhe është veçanërisht efektiv në detyrat matematikore dhe të programimit. Sipas krijuesve të tij në Universitetin e Inteligjencës Artificiale Mohamed bin Zayed (MBZUAI; në foto), instituti kryesor kërkimor i Abu Dhabit, ai i mposht shumicën e modeleve me burim të hapur në testet në ato fusha, megjithëse mbetet prapa sistemeve me performancën më të mirë të bëra nga Google dhe OpenAI.
Por kjo është e pritshme. Më i vogël se shumë prej paraardhësve të tij, me 32 miliardë parametra (d.m.th., lidhje matematikore midis nyjeve të një rrjeti nervor), K2 Think mund të funksionojë shpejt me pak fuqi llogaritëse. Ky avantazh shpejtësie forcohet më tej nga një qendër të dhënash e mbushur me çipa nga Cerebras, një startup amerikan i silikonit për IA. Këto çipa, më të mëdhenjtë në botë me madhësinë e një pjate darke, janë bërë nga një pllakë e vetme silikoni dhe janë të optimizuar për detyrën e inferencës—pra, funksionimin aktual të sistemeve të IA-së—në vend të trajnimit. Rezultati është një chatbot që nxjerr mijëra fjalë në sekondë. Eric Xing, presidenti i MBZUAI, thotë se kjo lajmëron “një epokë të re të IA-së me kosto efektive, të riprodhueshme dhe të përgjegjshme”.
Pavarësisht emrit të tij, sistemi i Emirateve nuk ka asnjë lidhje me Kimi K2, të krijuar nga Moonshot AI, një startup kinez i themeluar nga një inxhinier që më parë ka punuar në Google dhe Meta. Por ai ka rrënjë kineze: modeli i EBA-së është ndërtuar mbi Qwen 2.5, një LLM nga Alibaba, një gjigant kinez i tregtisë elektronike. Kjo i lejoi MBZUAI të anashkalonte detyrën e mundimshme dhe të kushtueshme të trajnimit të një modeli themelor nga e para dhe të përqendrohej në fazën e “pas-trajnimit”. Modeli që rezulton është plotësisht me burim të hapur: universiteti po ndan jo vetëm vetë modelin, por edhe kodin dhe të dhënat e trajnimit të përdorura për të formësuar Qwen 2.5.
Zgjedhja për të ndërtuar mbi një model kinez, në vend të një alternative amerikane me burim të hapur si Llama e Meta-s, është pjesë e një kalibrimi të kujdesshëm nga EBA mbi pozicionimin e saj mes shtytjeve dhe tërheqjeve gjeopolitike të IA-së. Në maj, vendi ishte i pari, pas Amerikës, që iu bashkua projektit Stargate të OpenAI. Që atëherë, është ndjekur nga të tjerë, përfshirë Britaninë dhe Norvegjinë. Ai planifikon të hapë një qendër të dhënash 200-megavat në 2026, përpara se ta zgjerojë atë në një grup të konsiderueshëm 1-gigavat.
Por EBA gjithashtu po përpiqet të krijojë një sektor specifikisht emiratas të IA-së. Peng Xiao, shefi i G42, një laborator i IA-së i mbështetur nga shteti, dhe anëtar i bordit të MBZUAI, e vlerësoi K2 Think për “provën se modele më të vogla e më me burime mund të rivalizojnë sistemet më të mëdha të arsyetimit”. Paralelet me qëllimet e vetë vendit për IA-në, si dhe rivalët rajonalë si Arabia Saudite, janë të qarta.
Lansimet e tjera të universitetit përfshijnë Jais, një LLM në arabisht, dhe NANDA, i cili flet gjuhën hindi. Janë këto modele, të cilat nuk janë në konkurrencë të drejtpërdrejtë me ofertat e gjigantëve amerikanë dhe kinezë, ato që përfaqësojnë shpresën më të mirë të EBA-së për të krijuar një treg rreth produkteve të saj të IA-së. Dhe mund të ndihmojë vetëm fakti që ato kanë edhe emra më origjinalë. ■
