szerző:
Tetszett a cikk?
Értékelje a cikket:
Köszönjük!

Forgatókönyvet, szinkronhangot is tud már generálni a mesterséges intelligencia, és elviekben már képes lehet arra is, hogy az elejétől a végéig összerakjon egy filmet. Nem csoda, hogy már Budapesten is rendeznek fesztivált az AI-filmeknek, amelyekből néhányat most mi is megmutatunk. Hogy mire képes 2024 elején a gép, arról pedig a fesztivál szervezőjét, alkotókat és Deák Kristóf Oscar-díjas filmrendezőt kérdezzük.

A Los Angeles-i Oscar Sharp és csapata, valamint a magát Benjaminnak nevező mesterséges intelligencia 2018-ban megalkották a Zone Out című kisfilmet. Korábban is voltak már próbálkozások AI-filmek létrehozására, de a Zone Out több tekintetben is felülmúlta az elődöket. Sharpék archív filmkockákat és kortárs színészekkel előre felvett alakításokat tápláltak a programba, majd hagyták, hogy a nyersanyagból, instrukciók mentén Benjamin az elejétől a végéig megcsinálja a maga filmjét. Összerakta a forgatókönyvet, a fekete-fehér szereplők és a kortárs színészek arcát kicserélte, hangot, párbeszédet generált a karaktereknek, és össze is vágta a jeleneteket. Az eredmény? Benjamin 48 óra alatt összedobott, ha nem is egy Oscar-díjas, de már mégiscsak egy filmre emlékeztető produktumot. Sőt, a gép „a humorát” is felvillantotta, amennyiben női főszereplőjének arcára bajszot applikált.

Mindez hat évvel ezelőtt történt, és hogy ma hol tart ehhez képest az AI-alapú filmtechnológia, arról kaphatunk némi benyomást az első budapesti Nemzetközi AI Filmfesztiválon.

Az eseményre, amelyet vasárnap rendeznek meg a Bem moziban, összesen 145 alkotás érkezett be. Neveztek filmmel az Egyesült Államokból, Ausztráliából, Dél-Amerikából, Ázsiából, de érkeztek szép számmal alkotások magyaroktól is. A felhívásra csak rövidfilmeket lehetett beküldeni, de a szervezőkhöz így is összesen hétórányi filmanyag ömlött be, amit előbb MOME-s, illetve METU-s hallgatók bevonásával előválogattak, majd ezt szűkítette tovább a bemutatásra érdemes munkákra a szakmai zsűri, név szerint Glaser Katalin animációs filmrendező; Pálfalusi Attila, a MOME média design tanszékének vezetője; Bakk Ágnes, a MOME Interakció és Immerzió Hub vezető kutatója; Deák Kristóf filmrendező és Kő Attila prompter, AI-artist.

Sallai Ervin reklámszakember tavaly nyáron döntötte el a fesztivál megvalósítását, mert mint mondja, régi vágya volt egy olyan szemlét csinálni, amely demokratizálja a filmkészítést, és nyitott a profik és a teljesen amatőrök felé is. Először a mobillal filmezőknek akart kedvezni, de amikor a mesterséges intelligencia hirtelen berobbant, és egyre több lelkes AI-artist jelent meg (jelenleg a magyar prompterek, vagyis a képgenerátorokkal alkotók hazai közössége, a Prompters Hungary közel négyezer főt számlál), akkor azonnal egyértelművé vált a számára, hogy inkább a mesterséges intelligenciával filmet készítőknek kellene bemutatkozási lehetőséget adni.

Sallai Ervin mesterséges intelligenciával, Wes Anderson stílusában megalkotott portréja
Sallai Ervin

Az AI hihetetlen gyorsan fejlődik. 2022 elején még nehézkes, bonyolult és költséges volt egy jó képgeneráló programmal értelmezhető alkotásokat létrehozni,

és a gép emberfelfogásával is akadtak problémák: nagy eséllyel háromszemű és hatujjú humanoidok jöttek ki a cső végén.

Ám, ami két évvel ezelőtt történt, az már olyan réginek számít a képgenerátorok történetében, hogy tán igaz se volt: ma már ugyanis sem erős gép, sem komoly technika, sem vastag pénztárca nem kell ahhoz, hogy a mesterséges intelligenciával bárki minőségi dolgot tudjon létrehozni. Szinte hetente jönnek ki az újabb és egyre jobb, párezer forintos előfizetést igénylő webes AI-alkalmazások – nemrég például a ChatGPT-t sikerre vivő OpenAI nyűgözte le a világot a szöveges parancsokból, vagyis promptokból fotórealisztikus videót készíteni képes Sora nevű programjával. Szakács Szilvia, a filmfesztiválra is bekerült Downgrade című film rendezője szerint most jött el az idő, hogy olyan emberek, akik még életükben nem csináltak filmet vagy animációt, és kézügyességük sincs, kifejezhessék magukat a gép segítségével. A Downgrade például a filmezés terén abszolút amatőr emberek munkája.

A Fritz Barbara által megírt disztópikus történet szerint a jövőben az emberek annyira belekényelmesednek a technológia által teljesen kiszolgált életükbe, hogy semmi motivációjuk nem marad, és drogokkal, virtuális valóságokkal próbálják meg elűzni az unalmukat. A kétségbeesett helyzetüket látva a gépek, vagyis a kiborgok közbeavatkoznak.

A film csapatmunkában készült, és az alkotók először a már megírt jelenetekhez szöveges utasítások alapján képeket generáltak, majd ezeket egy másik AI-programmal, ugyancsak szöveges parancsok mentén megmozgatták, vagyis animálták. Végül a szereplők szájába is a mesterséges intelligencia segítségével adták a hangot, de a vágást már hagyományos vágóprogrammal csinálták. „Egy-egy jelenetet 15-20 féle módon generáltunk le, és mindig kiválogattuk a legjobban sikerültek. Az AI abban segített, hogy létrejöjjön a jelenet, de végig ott kellett ülnie az embernek, aki szelektált. Egyfajta kurátori munkát végeztünk” – meséli a projektmenedzser Kő Attila (aki zsűritagként a saját filmjükre nem szavazhatott).

Hétperces filmjük körülbelül egy hónap alatt készült el, és mint látszik, még használtak hagyományos alkotási folyamatokat hozzá, klasszikus 3D-s technikát, de a forgatókönyvet is gép segítség nélkül írták. Az AI Filmfesztiválra a nevezésnél is csupán annyi volt az elvárás, hogy a filmeknek legalább 50 százalékban kell mesterséges intelligenciával készülniük, műfaji megkötés pedig nem igen volt: be lehetett küldeni narratív történetet, dokumentumfilmet, kísérleti alkotást és videoklipet is.

Az általunk megkérdezettek szerint a közeli jövőben a filmek, sorozatok csak részben készülnek majd AI-jal, de hogy lesz gépi rásegítés, az borítékolható. Deák Kristóf úgy gondolja, hogy egy-két éven belül már nem is lesz kérdés, hogy a filmesek egy adott produkcióhoz használtak-e mesterséges intelligenciát.

Ez ugyanolyan alkotói eszköz lesz, mint a 35 milliméteres film vagy a pasztellkréta

– fogalmaz.

Az AI ma már állóképek esetén zavarba ejtően jól teljesít, egy képről nem is tudjuk feltétlen azonnal eldönteni, hogy azt a gép alkotta-e vagy sem. Ugyanebben a műfajban a mozgóképek viszont most még maximum 4-5 percig tudják lekötni a figyelmünket, ezután már szinte biztos, hogy „lebukik az AI”, vagyis hibázik. Az a baj, mondja Kő Attila, hogy a szoftver által generált film nem igazán tud konzekvens maradni, emiatt a szemnek furcsa, olykor bizarr dolgokat produkál. Ez azért lehet, mert generáláskor a gép minden egyes mozzanathoz „egy rengeteg képből álló zajból, egy óriási adathalmazból választja ki a végeredményt”, amibe – az adatok hatalmas mennyiségénél fogva – könnyen hiba csúszhat.

Kő Attila

Sallai Ervin így fogalmazza meg tömören a problémát: „Nehéz létrehozni egy történetet úgy, hogy közben ne nőjön még két karja az embernek, ne öltözzön át, míg átmegy a képernyőn balról jobbra, és Tokió se változott át New Yorkká a háttérben.”

A reklámszakember prognózisa szerint épp ezért most leginkább az AI-videoklipek fognak „kilőni, mint az őrület”, mert ezekhez sem történetbeli, sem látványbeli következetességre, sem nagyobb büdzsére nincs szükség. „Azt a klipeknél már amúgyis megszoktuk, hogy van bennük egy kis forgatott, meg egy kis animáció, ugrálunk a térben és időben, majd jön egy napszemüveges kutya” – indokolja.

Az embernek evolúciós előnye van a géppel szemben

Deák Kristóf szerint a valósághű szereplők megteremtésével is meggyűlik a baja az AI-nak. Bár a deepfake valódi veszélyt jelent (lásd: a Ferenc pápáról, Emmanuel Macronról vagy Donald Trumpról készült kamu „fotókat”), és Hollywoodban jogosan tartanak attól a színészek, hogy a mesterséges intelligencia alkotta replikáikat az ő beleegyezésük nélkül használják fel tartalmakhoz, a filmrendező szerint a színészi alakítást borzasztó nehéz algoritmusokkal legenerálni. „Az evolúció során az emberben nagyon fejlett érzékek alakultak ki arra, hogy a másik szemének villanásából ki tudjunk találni a szándékát, vagy a hanglejtésének a legfinomabb kis rezdüléseiből érezzük, hogy hazudik-e az illető vagy sem. Iszonyatosan messze van még a ma elérhető voice over [gépi narráció – a szerk.] attól, hogy abból színészi játék legyen. Ráadásul egy színészi alakítás mögött egy komplett kitalált karakter és egy egész leélt élet kombinációja van. Szerintem a mesterséges intelligencia előbb-utóbb egy B-kategóriás színész felejthető alakítását fogja tudni produkálni, de a különlegességi faktort, ami egy A-listás színészben megvan, nagyon nehéz lesz elérni.”

Deák szerint a statiszták is rosszul járhatnak a jövőben, mert az ő arcuk kevésbé kivehető a filmen, sőt, kifejezetten előny, ha nincs feltűnő fizimiskájuk, a gép pedig már nagyon jó abban, hogy „soha nem létező arcokat álmodjon”.

Deák Kristóf
Szondy Dalma

A Smart Click összesítése szerint a nagy amerikai filmstúdiók eddig is alkalmaztak okos algoritmusokat például annak érdekében, hogy megtervezzenek egy promóciós kampányt az adott produkció potenciális közönsége; a benne szereplő sztárok rajongótáborának mérete és az alapján, hogy a film vagy sorozat hol tud majd nagyot durranni. A jövőben viszont könnyen elképzelhető, hogy egyre gyakrabban a filmzenét is AI-jal íratják majd, esetleg rábízzák a gépre egy film előkészületeit – segíthetne a helyszín kiválasztásában vagy a casting során, amikor egy nagy adatbázisból kell megfelelő paraméterek mentén a lehetséges színészeket kiválasztani –, de már arra is láttunk példát, hogy az IBM szuperszámítógépe rakta össze egy film, a Morgan című sci-fi előzetesét.

Deák Kristóf azt mondja, a pitcheléshez, amikor el kell adni egy filmötletet a finanszírozók felé, szintén jól jön az AI-képalkotás. „Pitchelnem kell az elképzeléseket olyan emberek számára, akik nem feltétlenül rendelkeznek nagy fantáziával, és sok előnye van annak, ha nemcsak egy stock fotóval, vagy már létező filmekből kivett snittekkel tudom illusztrálni az ötletet, és nem kell külön elmennem forgatni egy referenciaanyagot, hanem elég a géppel generálnom egy videót”.

A rendező azon gondolkodik, hogy a következő filmjéhez a különböző hanghatásokat – például lódobogás, puskatöltés, ruhák susogása – utólag manuálisan előidéző, úgynevezett zörejművész (foley artist) munkáját is megpróbálja kiváltani egy programmal, így jelentős mennyiségű munkaórát tudna megspórolni.

Kő Attila és Szakács Szilvia optimisták: szerintük az AI megkönnyítheti, meggyorsíthatja és olcsóbbá teheti a filmgyártást, de mindketten úgy gondolják, hogy „a szakembereknek, a fényelőktől kezdve a hangmérnökökig, igenis meg kell tanulniuk ezeket az új technológiákat használni, és azokat, akik nem fognak tudni lépést tartani a fejlődéssel, egyszerűen el fogják engedni”.

Szakács Szilvia

Szerintük hamarosan lelkes amatőrök, kisebb filmes társulások vagy közepes méretű stúdiók is olyan effekteket – robbanást, várost pusztító szörnyeket vagy űrjeleneteket – tudnak majd produkálni viszonylag egyszerűen a mesterséges intelligencia segítségével, amilyenekre most még csak a legnagyobb filmstúdiók képesek, mert nekik van rá kapacitásuk. „Teszem azt, most egy CGI-jelenet percenként 17 ezer dollárba kerül. Ez az AI-jal percenként 200 dollárba fog kerülni, és nem egy teljes stábra, csak egy ügyes kezű prompterre lesz szükség hozzá” – fogalmaz Kő Attila.

Jól érzékelteti az AI-képalkotás előretörését a 2019-es Scorsese-film, a The Irishman példája.

A színészek digitális „megfiatalítását” borzasztó drága kameraberendezésekkel, érzékelőkkel felszerelt jelmezekkel és külön motion capture stúdiókban oldják meg. A Netflix is dollármilliókat költött arra a hatalmas technikai apparátusra, amellyel Robert De Nirón és a többi szereplőn digitális ráncfelvarrást végeztek, mire jött egy youtuber, aki egy ingyenes deepfake szoftver segítségével, mindössze egyetlen hét alatt megugrotta a feladatot, és bizony, majdnem ugyanolyan jó lett a végeredmény.

Deák Kristóf viszont mégsem látja a technika minden aspektusát annyira derűsen. Az AI-ban az trükk – mondja –, hogy „minél többet használjuk, annál jobb lesz, és annál kevésbé lesz ránk szükség”.

Bár nem szabad túlmisztifikálni a mesterséges intelligencia képességeit, mert „a gépnek se mondanivalója, se motivációja nincs, és még a legjobb esetben is derivatív az, amit csinál, hiszen már meglévő dolgokból építkezik”, de lehet, hogy véget ér az a korszak – fogalmaz –, amelyben például Tarantino híresen nagy filmtörténeti tudása még érték. Ugyanis más filmrendezőket és régi nagy klasszikus filmeket megidézni – amit mondjuk Tarantino csinál a westernnel – már nem lesz nagy kunszt, hisz azt a gép is meg tudja majd csinálni.