Skip to content

Ne moramo da naglašavamo koliko je pojava Chat GPT-3 uzbudila duhove na globalnom nivou. A šta nas sledeće očekuje? Uzbuđenje raste u zajednici, pošto je tehnički direktor kompanije Microsoft u Nemačkoj, Andreas Braun, nedavno najavio da će GPT-4 biti predstavljen sledeće nedelje. Ako u Google-u nisu zabrinuti, trebalo bi da počnu odmah da brinu.

 

Da li ste spremni za GPT-4?

U izjavi od pre nekoliko dana on je rekao: „Predstavićemo GPT-4 sledeće nedelje, tamo ćemo imati multimodalne modele koji će nuditi potpuno različite mogućnosti – na primer video zapise.“ 

Trenutno nema najave gde će se sve GPT-4 pojaviti. Ali Azure-OpenAI je posebno pomenut. Očekuje se da će GPT-4 biti značajno poboljšanje u odnosu na GPT-3.5, sa mnogo većim kontekstnim prozorom, većom pouzdanošću i novim svojstvima koja će se pojaviti.

 

GPT-4 je multimodalan

Veliki zaključak iz najave je da je GPT-4 multimodalan. GPT-3 i GPT-3.5 su radili samo u jednom modalitetu, tekstu. Prema nemačkom novinskom izveštaju, GPT-4 bi mogao da funkcioniše u najmanje četiri modaliteta, slika, zvuk, tekst i video.

Braun je u nastavku izjave dodao da GPT-4 „menja pravila igre“ jer mašine sada uče da razumeju prirodni jezik, a zatim na statistički način razumeju ono što je ranije bilo čitljivo i razumljivo samo ljudima. U međuvremenu, tehnologija je stigla toliko daleko da u osnovi „radi na svim jezicima“. Možete postaviti pitanje na nemačkom i dobiti odgovor na italijanskom. Sa multimodalnošću, Microsoft(-OpenAI) će „učiniti modalitete sveobuhvatnim“.

 

Šta možemo da očekujemo?

Uprkos tome što je to jedna od najiščekivanijih vesti o veštačkoj inteligenciji, malo je javnih informacija o GPT-4. Kakav će biti, koje su njegove karakteristike ili sposobnosti? Prema Braunu, GPT-4 će ponuditi nove mogućnosti, kao što je video obrada, kao i multimodalnost (alat neće analizirati i proizvoditi samo tekst).

Budućnost dubokog učenja (deep learning) je multimodalnost. Ljudski mozak je multisenzoran, jer živimo u multimodalnom svetu. Sagledavanje sveta u pojedinačnim modalitetima uveliko ograničava sposobnost veštačke inteligencije da se kreće ili razume. Dobre multimodalne modele je znatno teže izgraditi nego one bazirane samo na jeziku ili samo na vizuelnom sadržaju. 

Ostaje da vidimo koliko je verovatno da će GPT-4 biti istinski multimodalan, u pravom smislu te reči. Multimodalan u smislu da možete da mu date verbalne instrukcije, možete da otpremate slike, možete mu dati bilo koji unos i da on to razume i u tom kontekstu proizvodi sve što poželite. Ukoliko zaista bude funkcionisao na tom principu, onda nas očekuje još uzbudljiviji period.

 

Za još vesti i interesantnih priča posetite našu blog stranu ili zapratite naš Instagram profil.

Ako je Vama potrebno Google oglašavanje, obratite nam se na linkove ispod:

Google Search Oglašavanje >
Google Display Oglašavanje >
Google Video Oglašavanje >

Made by Nebojša Radovanović – SEO Expert @Digitizer

Follow.

Sign Up.

GoodLinks.