Închide

Un nou instrument bazat pe inteligență artificială, dezvoltat de OpenAI, transformă textul în videoclipuri realiste

Avatar
Monitor screen with openai logo on black background

Fotografie de Andrew Neel pe Pexels

Timp de citire: 3 minute

„Sora”, noul instrument al companiei OpenAI, amplifică îngrijorările cu privire la fenomenul deep fake, în contextul în care inteligența artificială este tot mai implicată în alegerile din întreaga lume, scriu jurnaliștii de la The Washington Post.

Compania care dezvoltă sisteme bazate pe inteligență artificială OpenAI a prezentat un nou instrument AI care poate genera videoclipuri extrem de realiste, de 60 de secunde, pe baza unui mesaj text simplu. Este un pas înainte în domeniul videoclipurilor generate de inteligența artificială AI și al celor de tip„deepfake” care au fost deja folosite pentru a înșela alegătorii.

Noul instrument, numit „Sora”, va fi disponibil inițial doar pentru un grup mic de artiști și realizatori de film, precum și pentru cercetători care încearcă să depisteze modalități prin care un instrument AI poate fi folosit în scopuri rău-intenționate, a precizat OpenAI într-un comunicat citat de TVR.

Sora se bazează pe tehnologia din spatele DALL-E, instrumentul de generare de imagini dezvoltat de OpenAI. Acesta interpretează solicitarea unui utilizator, extinzându-l într-un set mai detaliat de instrucțiuni și apoi utilizează un model AI specializat în video-uri și imagini pentru a crea noul videoclip.

Calitatea imaginilor, a materialelor audio și video generate de AI a crescut vertiginos în ultimul an. Companii precum OpenAI, Google, Meta și Stable Diffusion sunt în competiție pentru a crea instrumente din ce în ce mai performante și a găsi modalități de a le vinde. În același timp, specialiștii preocupați de menținerea democrației și cercetătorii AI au avertizat că instrumentele sunt deja folosite pentru a păcăli și a minți alegătorii.

Companiile de tehnologie și-au construit propriile generatoare de inteligență artificială text-to-video (care transformă textul în video). Google testează un instrument numit Lumiere, Meta are un model numit Emu, iar start-up-ul AI Runway a creat deja produse pentru a ajuta realizatorii să creeze videoclipuri. Dar experții și analiștii AI spun că lungimea și calitatea videoclipurilor generate de Sora au depășit tot ceea ce s-a văzut până acum.

Nu mă așteptam la acest nivel de coerență în generarea video mai devreme de doi- trei ani”, a spus Ted Underwood, profesor de știința informației la Universitatea Illinois din Urbana-Champaign. Deși a avertizat că OpenAI a ales, probabil, videoclipuri care arată varianta cea mai bună a modelului, el a spus că „se pare că a existat un mic salt calitativ” față de alte instrumente text-to-video.

În Pakistan, fostul prim-ministru Imran Khan a folosit inteligența artificială pentru a crea o versiune digitală a lui însuși care susține discursuri, chiar dacă politicianul se află în închisoare. O reclamă care susținea campania guvernatorului Florida Ron DeSantis pentru a deveni candidatul republican la președinție a folosit un generator audio AI pentru a imita vocea fostului președinte Donald Trump.

Companiile de tehnologie care construiesc instrumentele spun că monitorizează utilizarea instrumentelor lor și au instituit unele politici împotriva utilizării acestora pentru a produce conținut politic. Dar aplicarea acestor politici nu se face cu consecvență. În ianuarie, OpenAI a suspendat un dezvoltator care făcuse un bot al candidatului democrat Dean Phillips, doar după ce The Washington Post a scris despre acest fapt. Dezvoltatorul a creat bot-uri similare de candidați politici în toamnă.

Generatoarele video bazate pe AI au făcut deja furori la Hollywood. Realizarea de filme este costisitoare, necesită timp și zeci sau sute de oameni. Unii specialiști spun că AI ar putea permite unei singure persoane să realizeze un film cu aceeași complexitate vizuală ca un blockbuster Marvel.

Faptul că astfel de instrumente AI sunt create folosind munca artiștilor din viața reală fără a-i compensa este o mare problemă. „Nu este grozav atunci când este nevoie de creativitatea, munca și ideile altor oameni și nu li se acordă meritul cuvenit și nici remunerație financiară.” a precizat regizorul de film Michael Gracey.

Mutale Nkonde, cercetător la Oxford Internet Institute, a spus că ideea că oricine poate transforma cu ușurință textul în video este incitantă, dar își face griji cu privire la modul în care aceste instrumente ar putea include aspecte sociale controversate, impactul lor asupra mijloacelor de trai ale oamenilor și capacitatea lor de a transforma textele care implică ura sau descrierile evenimentelor groaznice din lumea reală în materiale video supărător de realiste.

Recentele proteste ale scriitorilor și actorilor din SUA, a spus Nkonde, au început să ridice întrebări despre utilizarea instrumentelor de limbaj AI în scenarii și utilizarea actorilor similari cu cei reali în scenele generate de AI. Cercetătoare a atras atenția că instrumente precum Sora ridică noi întrebări, cum ar fi aceea dacă oamenii vor mai fi necesari. „Din punct de vedere politic, trebuie să începem să ne gândim la modalități în care putem proteja oamenii”

Calitatea videoclipurilor Sora, în special a celor menite să arate imagini ca în viața reală, este mai mare decât ceea ce majoritatea celorlalte companii de AI au putut să producă până acum.

scroll to top