A mesterséges intelligencia eszközök hihetetlenül gyorsan fejlődnek, most az OpenAI ismét nagyot lépett előre az új ChatGPT 4o kiadásával (4o, amiből az o az omni-t jelenti, tehát nem 4pontnulla). Ebben a blogbejegyzésben bemutatom az új funkciókat és fejlesztéseket.
Ez a modell a Plus előfizetőknek elérhető (ingyenesen jelenleg csak kipróbálható, napi néhány kérdéssel), a webes felület automatikusan frissült is, azonban a mobilapplikációra manuális frissítést kellett indítanom, és utána megjelent az új modell is. A magyar akcentusa még mindig erős, de teljesen jól használható, ha nem akarsz pötyögni, akkor beszéd alapú kommunikációt is folytathatsz vele, utána pedig az egész beszélgetést írásos formában is megjeleníti.
ChatGPT-4o: milyen újítások vannak az OpenAI új modelljében?
Az új modell számos fejlesztéssel és új funkcióval érkezik, amelyek még hatékonyabbá és sokoldalúbbá teszik a ChatGPT-t. Az egyik legnagyobb előnye a nagyobb pontosság és megértés. A ChatGPT-4o még pontosabb válaszokat ad, mélyebben megérti a felhasználói kérdéseket.
Már az első napok tesztjei során feltűnt, hogy gyorsabban megérti a kontextusokat, nem kell agyonmagyaráznom a dolgokat, és jól átgondolt promptokkal (prompt = utasítás, erről cikket itt és itt találsz) elsőre tökéletesen felhasználható szövegeket kaptam. Történelmi kérdésekben is teszteltem, és nem csak a kérdésre válaszolt, hanem további, az adott korhoz szorosan kapcsolódó, fontos adatot is elmondott. Amikor szakmai cikkek induló alapszövegét írattam vele, kértem, hogy pakoljon bele kulcsszavakat, ami az oldal számára fontos lehet, hogy megjelenjen rá a Google keresőben, nagyon ügyesen, ugyanakkor szinte észrevétlenül csempészte bele őket a szövegbe.
Az OpenAI által bemutatott videók szerint már képes arra is, hogy egy videóban azonosítsa a beszélő ember hangulatát, stílusát, és ő maga is tud különböző stílusokban, hangulatokban beszélni. Felismer különböző helyzteket, szituációkat, ha valaki nyűgös, fáradt, szomorú, akkor akár meg is vígasztalja, de egy szülinapi ünneplést is felismert, és ő is megköszöntötte az ünnepeltet.
Szövegírás és beszéd
A továbbfejlesztett nyelvi képességek révén a ChatGPT-4o még természetesebben és folyékonyabban kommunikál, már egyre kevésbé lehet megállapítani, hogy AI írta a szöveget. Teszteltem blogcikkek és marketing szövegek írásával, először meg is kellett kapaszkodnom az asztal szélében, olyan gyorsan készítette el a tartalmat, hogy szinte lobogott a hajam 🙂 Úgyhogy valóban sokkal gyorsabb lett (állításuk szerint 5x gyorsabb, mint a GPT-4), sokkal hosszabb és emberibb szöveget kaptam.
Telefonon teszteltem a beszélgetés funkciót is, angolul nagyon patika, magyarul viszont még mindig erős az akcentusa. Teljesen jól lehetett érteni, hogy mit mond magyarul, kivéve a számokat, ott nem is lehetett érteni, mennyit mond, szóval a matek leckét még nem biztos hogy érthetően el tudja mondani.
Képfelismerés
Az új modell egyik izgalmas újdonsága a képfelismerő és -értelmező képesség. Ezentúl nem csak szöveges utasításokat adhatunk, hanem feltölthetünk képet, hangot, és akár videót is. A bemutatójukban egy felhasználó saját magát kamerázta, és megkérte a GPT-4o-t, hogy írja le, mit lát körülötte, és szerinte éppen mit csinál. Olyat is mutattak, hogy valakinek matematikát tanított, és ahogy írta a tanuló a megoldást, úgy egyből értelmezte, megdícsérte, vagy ha kellett javította, elmagyarázta a megoldást. Ezt a funkciót sajnos még nem tudtam tesztelni, mert nekem még nem kapcsolták be a videó funkciót, de amint aktív lesz, tesztelem, és frissítem a cikket.
Kreativitás
A ChatGPT-4o kreativitása is tovább fejlődött. Ez még jobb történetek, szövegek és marketing kampányok készítését teszi lehetővé.
Jobb memória
Fejlettebb memória funkcióval is rendelkezik, amely lehetővé teszi a hosszabb beszélgetések nyomon követését és a konzisztens válaszok biztosítását. Ez főleg olyan esetekben hasznos, amikor fontos, hogy az AI emlékezzen a korábbi beszélgetésekre.
További képességek, amik még várhatóak
Az OpenAI bejelentése alapján sok új képessége van, amiket egyelőre még nem teljesen tiszta számomra, hogy pontosan hogyan lehet majd használni, sok funkció biztosan nem a ChatGPT-n belül lesz, hanem valószínűleg API-val vagy eszközökbe beleépítve lesz elérhető. Például egy online meetinget is mutattak, ahol az AI asszisztensként vett rész. Én voltam már olyan meetingen, ahol a Microsoft Copilot volt behívva, és élőben feliratozta a beszédemet, és a meeting végén egy összefoglalót is írt névre szóló feladatlistákkal, na arra azt mondtam, hogy nem semmi, gondolom erre már ez a rendszer is képes.
Közzétett még az OpenAI olyan videókat is, ahol valós idejű tolmácsgépként használták, illetve úgy beszélgettek vele, mintha egy ember lenne, nevetgélt, viccelődött, szerintem hamar eljutunk oda, hogy úgy lehet majd vele kommunikálni, mint JARVIS-al a Vasember filmekben.
A modell korlátai és biztonsági intézkedések
Bár a GPT-4o számos fejlesztést és új funkciót kínál, fontos tisztában lenni a modell korlátaival és az OpenAI által bevezetett biztonsági intézkedésekkel.
Bár sokkal pontosabb, mint elődei, még mindig előfordulhat, hogy hibás vagy pontatlan információkat ad. Különösen összetett vagy szakmai kérdések esetén javasolt az AI által adott válaszok ellenőrzése.
Az AI hajlamos lehet úgynevezett „hallucinációkra„, amikor olyan információkat generál, amelyek valójában nem léteznek vagy nem helytállóak. Ezért fontos még mindig kritikusan szemlélni és ellenőrizni a modell által generált szövegeket.
A GPT-4o, mint minden AI modell, hordozhat előítéleteket és elfogultságokat, amelyek a képzési adatokból származhatnak. Az OpenAI folyamatosan dolgozik ezen előítéletek csökkentésén, de teljes mértékben sosem lehet kiküszöbölni őket.
Ha nagyobb méretű dokumentumot vagy adatot adunk meg neki elemzésre, mindig kérdezzünk vissza, hogy a teljes dokumentumot átnézte-e, és ellenőrizzük is szúrópróbaszerűen.
A GPT-4o modell beépített biztonsági funkciókkal rendelkezik, amelyek különböző technikákon alapulnak, mint például a képzési adatok szűrése és a modell viselkedésének finomhangolása utóképzés révén. Új biztonsági rendszereket hoztak létre, hogy a hangkimenetekre is védelmet nyújtsanak. Mindig gondoljuk végig, hogy milyen képi- vagy hanganyagot osztunk meg vele, és ne kockáztassunk, érzékeny adatokat lehetőség szerint ne töltsünk fel.
Korábbi cikkek a ChatGPT-ről:
3 új funkció a ChatGPT-ben, amit még ma ki kell próbálnod!
Promptírás alapjai – hatékony kommunikáció a ChatGPT-vel