OpenAI prezintă Sora, modelul său de inteligență artificială text-la-video

openai sora

OpenAI lansează un nou model de generare a videoclipurilor, și anume Sora. Compania de inteligență artificială afirmă că Sora “poate crea scene realiste și imaginative din instrucțiuni textuale”. Acest model text-la-video permite utilizatorilor să creeze videoclipuri foto-realiste de până la un minut lungime – toate bazate pe prompt-urile pe care le-au scris.

Conform postării introductive de blog a OpenAI, Sora este capabil să creeze “scene complexe cu mai mulți caractere, tipuri specifice de mișcare și detalii precise ale subiectului și fundalului”. Compania notează de asemenea că modelul poate înțelege cum obiectele “există în lumea fizică”, precum și să “interpreteze precis accesorii și să genereze personaje captivante care exprimă emoții vibrante”.

Capacitățile lui Sora

Modelul poate genera și un videoclip bazat pe o imagine statică, precum și să completeze cadre lipsă într-un videoclip existent sau să-l extindă. Demourile generate de Sora incluse în postarea de blog a OpenAI includ o scenă aeriană a Californiei în timpul goanei după aur, un videoclip care pare să fie filmat din interiorul unui tren din Tokyo și altele. Multe au unele semne evidente de inteligență artificială – cum ar fi un podea care se mișcă suspect într-un videoclip dintr-un muzeu – iar OpenAI afirmă că modelul “poate avea dificultăți în simularea precisă a fizicii unei scene complexe”, dar rezultatele sunt în general impresionante.

Sora și alte modele similare

Cu câțiva ani în urmă, generatorii text-la-imagine, cum ar fi Midjourney, erau în fruntea abilității modelelor de a transforma cuvintele în imagini. Dar recent, videoclipul a început să evolueze la un ritm remarcabil: companii precum Runway și Pika au prezentat propriile lor modele impresionante de text-la-video, iar Lumiere de la Google pare să fie unul dintre principalii competitori ai OpenAI în acest domeniu. Similar cu Sora, Lumiere oferă utilizatorilor instrumente de text-la-video și le permite, de asemenea, să creeze videoclipuri dintr-o imagine statică.

Disponibilitatea lui Sora și perspectivele viitoare

Sora este în prezent disponibil doar pentru “echipele roșii” care evaluează modelul pentru posibilele daune și riscuri. De asemenea, OpenAI oferă acces unor artiști vizuali, designeri și realizatori de film pentru a obține feedback. Compania subliniază faptul că modelul existent s-ar putea să nu simuleze precis fizica unei scene complexe și s-ar putea să nu interpreteze corect anumite cazuri de cauzalitate.

La începutul acestei luni, OpenAI a anunțat că adaugă filigrane la instrumentul său de text-la-imagine DALL-E 3, dar notează că acestea pot fi “ușor înlăturate”. La fel ca celelalte produse AI ale sale, OpenAI va trebui să se confrunte cu consecințele videoclipurilor false, fotorealiste, create de AI, care sunt confundate cu realitatea.

Întrebări frecvente:

1. Ce este Sora și ce poate face?

Sora este un model de inteligență artificială dezvoltat de OpenAI, specializat în generarea de videoclipuri realiste pornind de la instrucțiuni textuale. Acesta poate crea scene complexe, inclusiv personaje, mișcări și detalii precise, bazându-se pe prompturile primite.

2. Cum funcționează Sora?

Sora utilizează o rețea neurală pentru a analiza instrucțiunile textuale și a genera videoclipurile corespunzătoare. Modelul înțelege contextul și detaliile din prompturi și apoi creează scene video relevante și realiste.

3. Ce tipuri de videoclipuri poate genera Sora?

Sora poate genera videoclipuri de până la un minut lungime, acoperind o varietate de teme și scenarii. Acestea pot include scene aeriene, scene urbane, interacțiuni între personaje și multe altele.

4. Care sunt aplicațiile practice ale lui Sora?

Sora poate fi utilizat în diferite domenii, precum producția de film, publicitate, jocuri video și educație. De asemenea, poate fi util în crearea de conținut digital pentru diverse platforme online.

5. Ce restricții există în utilizarea lui Sora?

Deși Sora poate genera videoclipuri impresionante, există unele limite și probleme potențiale. Modelul poate avea dificultăți în simularea precisă a fizicii unor scene complexe și în interpretarea corespunzătoare a anumitor aspecte ale cauzei și efectului.

6. Cine poate avea acces la Sora?

Sora este disponibil în prezent doar pentru “echipele roșii” care evaluează modelul pentru posibilele daune și riscuri. De asemenea, OpenAI oferă acces unor artiști vizuali, designeri și realizatori de film pentru a obține feedback și sugestii de îmbunătățire a modelului.

7. Cum poate fi folosit Sora în viitor?

Sora are potențialul de a revoluționa modul în care sunt create și utilizate videoclipurile digitale. Cu dezvoltarea continuă a tehnologiei, se așteaptă ca Sora să fie integrat într-o gamă tot mai largă de aplicații și să ofere noi oportunități pentru creatorii de conținut.

Sursa: https://www.theverge.com/2024/2/15/24074151/openai-sora-text-to-video-ai