A mesterséges intelligencia (AI) rohamos fejlődése újabb fejezetet nyitott a képi ábrázolás történetében. Eddig a tökéletesre retusált arcok és testek a magazinok címlapjain a profi fotósok gondos munkájának eredményeként születtek, valamilyen grafikai programmal eltüntetve a bőrhibákat, kiemelve az előnyös vonásokat, és irreális szépségstandardokat teremtve.
Azonban a generatív AI eszközök, mint a Dall-E, Midjourney vagy a Leonardo AI, forradalmasítják a képek generálását. Ahelyett, hogy retusálnának meglévő fényképeket, ezek az eszközök szöveges leírások alapján hoznak létre lenyűgöző képeket. Ez azt jelenti, hogy bárki, bármilyen művészi tehetség vagy fotós tapasztalat nélkül, hihetetlenül látványos képeket készíthet.
Ez a fejlődés egyben aggodalomra is okot adhat. A generált képek gyakran irreálisan tökéletes arcokat és testeket ábrázolnak, tovább erősítve a torz szépségstandardokat.
Miért uralják a tökéletes arcok a generált képeket?
Az AI algoritmusok a meglévő adatkészletekből tanulnak, amelyek gyakran torzítják a valóságot, idealizált szépségstandardokat tükrözve. A szépség szubjektív fogalom, nehezen ragadható meg algoritmusokkal. A fotók és művészeti alkotások, amelyekből az AI tanul, gyakran manipuláltak, a szépség idealizált formáját mutatják be. Bizonyos képgeneráló AI modellek kifejezetten csak modell alkatú képeken lettek tanítva, ezért szinte lehetetlen nem tökéletes arcot generálni velük.


A marketing óriási hatással van a szépségről alkotott képünkre. A diszkrimináció és a sztereotípiák megerősítése, a testképzavarok és az önbizalomhiány súlyosbodása, a valóságtól elrugaszkodott ideálok propagálása mind etikai aggályokat vetnek fel a generatív AI eszközökkel kapcsolatban.
Miért uralják a tökéletes arcok a generált képeket?
Az AI algoritmusok a leggyakoribb mintákat keresik az adatkészletekben. Mivel a tökéletes arcú emberek képei a legelterjedtebbek, az AI ezeket fogja reprodukálni a legnagyobb valószínűséggel.
Az AI algoritmusok hatalmas adatkészleteken tanítva tanulnak. Ezek az adatkészletek képeket és szövegeket is tartalmazhatnak. Az algoritmusok megtanulják felismerni a képeken szereplő arcok általános jellemzőit, mint például a szem, az orr, a száj és a haj formáját. Azonban nem tudják észrevenni a finomabb árnyalatokat, mint például a bőr textúráját, a szemek színét, a tekintet mélységét, vagy az arckifejezés finom változásait.
Emiatt az AI által generált arcok gyakran sablonosnak és egyedinek tűnnek. Hiányzik belőlük a valós arcokra jellemző változatosság és sokszínűség. A szépség szubjektív fogalmát sem értik, így a „tökéletesség” általuk használt definíciója gyakran torz és irreális.
Képzeljünk el egy adatkészletet, amelyben az összes arc fehér bőrű, kék szemű és szőke hajú. Az AI algoritmus ezen adatkészleten tanítva megtanulja, hogy az emberi arc fehér bőrű, kék szemű és szőke hajú. Ha egy olyan szöveget kap bemenetként, amely egy emberi arcot ír le, az algoritmus valószínűleg egy fehér bőrű, kék szemű és szőke hajú arcot fog generálni.
A fejlesztők szándékosan is befolyásolhatják az algoritmusokat, hogy bizonyos esztétikai preferenciákat tükrözzenek.
Fontos megjegyezni, hogy a generatív AI eszközök még gyerekcipőben járnak. A jövőben várhatóan fejlődni fognak a képességeik, és jobban tükrözni fogják a valós sokszínűséget.
A felelősségteljes fejlesztés és alkalmazás nagyon fontos a torz szépségstandardok elleni küzdelemben.
A generált képek hatása a társadalmi normákra és a testképre
Azok az emberek, akik nem felelnek meg a torz szépségstandardoknak, kirekesztettnek érezhetik magukat. Ez súlyosbíthatja a testképzavarokat és az önbizalomhiányt. A generatív AI eszközök tovább fokozhatják a szépségversenyt, ami irreális elvárásokat teremt, és nyomást gyakorol az emberekre, hogy megfeleljenek a „tökéletes” arcnak/testnek.
A nők különösen ki vannak téve a generatív AI eszközök negatív hatásainak. A társadalom már eleve irreális elvárásokat támaszt a női testtel szemben, és a generált AI képek tovább erősíthetik ezeket az elvárásokat.
Mit tehetünk?
- Támogassuk a sokszínűséget a generatív AI eszközök fejlesztésében és alkalmazásában.
- Ne csak tökéletes arcú/testű embereket jelenítsünk meg a marketingkampányainkban.
- Ha generált emberről készült képet használunk, mindig jelöljük meg, hogy a kép nem valós embert ábrázol.
- Ösztönözzük az emberek kritikus gondolkodását, segítsünk nekik felismerni a generált tartalmakat, és tudatosítsuk bennük, hogy ezek nem valós emberek.
- Tanítsuk meg a fiataloknak, hogy értékeljék a belső értékeket a külsőségek helyett.
A generatív AI eszközök hatalmas lehetőségeket hordoznak magukban, de felelősségteljesen kell őket fejleszteni és alkalmazni. A tökéletes arcok kizárólagos propagálása helyett a sokszínűségre és az önkifejezésre kell összpontosítanunk. Csak így építhetünk egy olyan jövőt, ahol mindenki komfortosan érezheti magát a bőrében, függetlenül a külső megjelenésétől.
Megpróbáltam nem tökéletes arcokat generálni. Nem volt könnyű.
A Leonardo AI eszközét használom leggyakrabban, főleg akkor, ha emberek is kellenek a képre. Fantasztikus képeket generál, szinte lehetetlen megmondani, hogy AI generált vagy igazi ember.
Bármelyik modelljével próbálkoztam, nem reagált az olyan utasításokra, hogy legyen idős, öreg, kövér, duci, csúnya, pattanásos stb. Bármilyen negatív jelzőt használtam, egyszerűen nem rakta rá a képre az kért módosítást. Végül már olyan promptokkal próbálkoztam, ahol sérült arcot, beesett és fáradt szemeket kértem – így sikerült elérnem némi eredményt. Nyilván függ az adott modelltől, hogy milyen eredményeket ad, főleg igaz ez a Leo Photoreal modelljeire, hiszen ezek tökéletes arcok létrehozására lettek tanítva, úgyhogy nem is erőlködtem tovább, ez az eszköz nem arra való, hogy valós arcokat generáljunk.
Leonardo AI generált képek



Keresgéltem néhány példát Stock fotó oldalakon, hogy megnézzem, más képgenerátorokkal miket alkottak. A Midjourneyvel egész élethű képek születtek, bár kissé agasztó, hogy az „average woman” vagyis átlagos nő kulcsszóra extrém túlsúlyos találatokat kaptam csak.
Midjourney generált képek


Dall-E-val próbálkoztam még, itt az volt az érdekes, hogy mivel nem adtam bőrszínt vagy etnikumot, ezért vegyesen fehér és színesbőrű embert is generált, ennek örültem, mert végre nem csak a szöszi-kékszemű az alapértelmezett nőmodell. Elsőre korrekt eredményt kaptam, bár a Dall-E-val generált arcok nekem még mindig kicsit műanyag érzetűek.
DALL-E generált képek


Használjuk jól
A mesterséges intelligencia által generált képek lenyűgöző lehetőségeket hordoznak magukban, de felelősségteljesen kell őket fejleszteni és alkalmazni. A tökéletes arcok kizárólagos propagálása helyett a sokszínűségre és az önkifejezésre kell összpontosítanunk. Csak így építhetünk egy olyan jövőt, ahol mindenki komfortosan érezheti magát a bőrében, függetlenül a külső megjelenésétől.
Tetszett ez a cikk? Akkor a hírlevelemet imádni fogod! Iratkozz fel és rendszeresen értesítelek a legújabb AI és digitális marketing hírekről.