A Meta - Mark Zuckerberg vállalata - pár napja megjelentette a Llama nevű mesterséges intelligenciájának legújabb frissítését a Llama 3-at. Ennek első verziója még tavaly februárban látott napvilágot, a második júliusban, a Meta asszisztense, vagyis csevegőrobotja, a Meta AI pedig szeptemberben, igaz akkor még csak az USA-ban, és ott is csak korlátozottan volt hozzáférhető. Ez akkor a Llama 2-es modellre épült, és beépült a Facebookba, az Instagramba, a WhatsAppba és a Messengerbe is. A Llama 3-mal - amelynek most a nagy és két kisebb változata is megjelent a múlt héten - angolul már Ausztráliában, Kanadában, Új-Zélandon, Ghánában, Jamaicán, Malawiban, Nigériában, Pakisztánban, Szingapúrban, Dél-Afrikában, Ugandában, Zambiában és Zimbabwében is elérhető, ez több, mint 3 milliárd embert jelent.
A részlegesen nyílt - tehát bizonyos tulajdonságait tekintve bárki által javítható - Llama kezdetben csak a kutatók és a fejlesztők számára volt elérhető. A Llama 2 már széleskörű elismertségre tett szert a köreikben, több tucat finomított variánst alkottak, és tettek közzé. A Meta a legújabb változatot még erősebbé tette a többi nyílt kódú versenytársánál, a francia Mistralnál és a Google nyelvi modelljénél, a Gemmánál: a legtöbb területen jobban teljesít, ami azért is fontos, mert ezen alapul az említett asszisztens, amely a népszerű közösségimédia platformokban a nagyközönséget is szolgálja, hamarosan globálisan is.
“A cél az, hogy a Meta AI-asszisztense a legfejlettebb legyen, amit ingyenesen, szabadon lehet felhasználni az egész világon. A Llama 3 - úgy érezzük - alapvetően már ilyen” - mondta Zuckerberg a Meta tulajdonos-vezérigazgató The Verge magazinnak. A cikk írójának tudomása szerint a Meta AI jelenleg az egyetlen csevegőrobot, amely a Bing - a Microsoft keresője - vagy a Google által talált adatokat azonnal beépíti válaszaiba, a kettő közül a gyorsabbat választva. Az újdonság, hogy mindkettőt használja, a többi említett program csak valamelyiket a kettő közül. A Llama 3 már jelentősen kevesebb hibás elutasítást ad, nem hajlandó olyan válaszokat adni, amivel másoknak árthat. A képgenerálása is szintet lépett, tud már mozgóképeket, alapvetően GIF képformátumokat alkotni, sőt az alkotást már a szöveg gépelése közben elkezdi, ezt Zuckerberg a Facebook oldalán be is mutatja.
A Llama 2-őt még csak 2 billió token alapján képezték - a token olyan szó vagy értelmi egység, amelyből összeáll a modell -, míg a Llama 3 nagy verzióját 15 billió token alapján. (Hasonló adatokra az Open AI-tól, a ChatGPT megalkotójától még várni kell.) “Nem hiszem, hogy az embereknek a Meta AI-je jut első körben az eszükbe, ha az általuk használt mesterséges intelligenciákra gondolnak. De itt a pillanat, amikor elkezdjük bemutatni, és valóban úgy gondolom, hogy ez vezető produktum lesz” - jelentette ki a Meta vezérigazgatója.
Beszélő fejek
A Microsoft ázsiai fejlesztőcsoportja VASA-1 néven olyan mesterséges intelligenciát (MI) hozott létre, amely egyetlen fotó és hangminta alapján olyan realisztikus videókat alkot - igaz csak beszélő fejeket -, amelyek szájmozgása - a beszéddel való szinkronitása - tökéletes. Mindehhez a programnak elég két perc. A VASA-t egyelőre még csak a fejlesztőcsoport használhatja, nyilvános hozzáférhetőségét még nem tervezik. Hasonló száj- és fejmozgató technológia már a Runwaytől és a Google-től is hozzáférhető, de azok még korántsem ilyen fejlettek, bár a VASA-1 modeljei is még kissé mesterkélten viselkednek. Az egyik leglenyűgözőbb dolog, hogy nincs szükség portré stílusú képre ahhoz, hogy működjön. A tervek szerint egyelőre videójátékokban fogják alkalmazni a VASA-1-et. Az alkotók külön hangsúlyozzák, hogy nincs szándékukban lehetővé tenni, hogy megtévesztő célokra is alkalmazható legyen.