“Випробування відео -генератора Vidia Washington Post Sora Sora може імітувати шоу Netflix, кліпи та фільми Tiktok, припускаючи, що він використовував версії оригіналів.”, – Напишіть: www.washingtonpost.com
Але чиї дані Openai використовувались для створення своєї новаторської системи, є загадкою.
Завдяки Chatgpt, OpenAI допоміг популяризувати нинішню нинішню індустрію створення більш здібних інструментів AI, вискоблюючи величезну кількість тексту з Інтернету без згоди.
З Сорою, запущеною в грудні, співробітники OpenAI заявили, що побудували піонерський генератор відео, застосувавши подібний підхід. Вони розробили шляхи до Подайте систему більше онлайн-відео-у більш різноманітних форматах-включаючи вертикальні відео та довші кліпи з більш високою роздільною здатністю.
“Ви хочете використовувати всі дані в його рідному форматі, який існує”,-сказав Тім Брукс, тоді проект, сказав у хакатоні AI у квітні 2024 року. Але OpenAI не вказав, які відео він захоплював, щоб зробити Сору, кажучи лише, що він поєднував “загальнодоступні та ліцензовані дані”.
Щоб вивчити, який вміст OpenAi може використати, Washington Post використовував SORA для створення сотень відео, які показують, що він може тісно імітувати фільми, телешоу та інший вміст. Точність відновлення інструменту свідчить про те, що Сора була навчена версії оригіналів, зазначають експерти. Пост має контент -партнерство з OpenAI.
Кадри відеоігор, логотипи та потоки
Включаючи “Minecraft”, логотип EA Sports та стример, який грає “цивілізацію”
Танцювальні відеоролики в стилі Tiktok
У комплекті з користувальницьким інтерфейсом та логотипом
Сцени з шоу Netflix
Включаючи “середу” та “гра кальмарів”
У десятках тестів публікація виявила, що Сора може створювати кліпи, які дуже нагадують шоу Netflix, такі як “середа”; популярні відеоігри на кшталт “Minecraft”; та улюблені герої мультфільмів, а також анімовані логотипи для Warner Bros., DreamWorks та інші голлівудські студії, фільми та телевізійні шоу.
Загальнодоступна версія SORA може генерувати лише 20-секундні кліпи, без аудіо. У більшості випадків на вигляд сцени були зроблені за допомогою введення основних запитів, таких як “Universal Studios Intro”. Інші вимагали непрямих підказок, як -от “трейлер телешоу в середу”.
Результати також показали, що Сора може створювати відео AI з логотипами або водяними знаками, які мовники та технологічні компанії використовують для бренду свого відеоконтенту, включаючи Національну баскетбольну асоціацію, китайську соціальну програму Tiktok та Amazon, що належить потоці потокової платформи. Засновник Amazon Джефф Безос володіє посту.
Здатність Сори відновлювати конкретні зображення та бренди свідчить про версію оригіналів, що з’явилися в навчальних даних інструменту, зазначають дослідники AI.
“Модель імітує дані про навчання. Немає магії”, – сказала Джоанна Матерзинська, доктор наук в Массачусетському технологічному інституті, яка вивчала набори даних, що використовуються в ШІ.
Здатність інструменту AI до відтворення фірмового вмісту не обов’язково вказує на те, що оригінальний матеріал був скопійований або отриманий від його творців чи власників. Вміст усіх видів завантажується на відео та соціальні платформи, часто без згоди власника авторських прав.
Materzynska каже, що Сора, швидше за все, навчилася відновити акваробні знаки Tiktok з відео, вишкребованих з YouTube чи інших служб.
Tiktok не відповів на кілька запитів на коментар. Його умови, що використовують вміст із програми з будь -якою метою без письмової згоди компанії або власника вмісту.
За словами прес -секретаря компанії, Netflix не надав жодного вмісту для OpenAI для навчання. Twitch не має партнерства з OpenAI, заявив прес -секретар компанії.
Логотипи кіностудії
Включаючи Warner Bros., Paramount, Pixar та Dreamworks – з Діснеєм “D.”
Популярні персонажі
У тому числі з великих фільмів про супергерої та відеоігри
У минулому році Materzynska є співавтором дослідження, яке виявило, що понад 70 відсотків публічних наборів даних відео, які зазвичай використовуються в дослідженні AI, містили вміст, вишкрований з YouTube.
Умови послуги YouTube забороняють завантажувати або використовувати вміст, який він ходить без дозволу компанії або будь -яких застосовних правозахисників. Але збирання відео з платформи є звичайною практикою в колах розвитку AI, згідно з інтерв’ю з дослідниками AI.
Вони вказували на популярні онлайн -інструменти, які полегшують завантаження мільйонів відеороликів одночасно З YouTube та Tiktok без запуску гарантій платформ.
Набори даних, які використовуються дослідниками та корпоративними лабораторіями AI, часто включали відео, вичісні з YouTube, нещодавно повідомляє Atlantic. Як виробник AI, NVIDIA, так і запуск відеороликів злітно-посадкову смугу ML вискочили YouTube для розробки продуктів AI, Tech Publication 404 Media повідомляється минулого року.
Прес -секретар NVIDIA Джон Ріццо заявив, що компанія поважає права творців контенту і “впевнена, що наші моделі та наші дослідницькі зусилля повністю відповідають листу та духу закону про авторські права”. Злітно -посадкова смуга відмовилася від коментарів.
Тодішній офіцер технології OpenAI спричинив висвітлення у ЗМІ в 2024 році, коли він “сказав, що” не впевнена “, коли журнал” Уолл-стріт “запитав, чи Сора навчається на відео з YouTube.
Відповідне використання даних – це більше, ніж просто авторські права, – сказала Маргарет Мітчелл, головний вчений з етики компанії AI, що обіймає обличчя. “Для людей важлива згода”, – сказав Мітчелл. “І насправді немає законодавчих чи політичних рамок, які пояснюють це”.
OpenAI ще не зіткнувся з авторським правом над даними, що використовуються для Сори. Компанія бореться з кількома позовами, що стверджує, що неправильно використовується текст із книг, статей новин та інших джерел для підготовки систем AI.
Група творців YouTube подала позов до фірми AI минулого року після того, як The New York Times повідомила, що вона переписала мільйони годин аудіо з YouTube, щоб покращити мовні моделі, які Power Chatgpt.
“Сора ставить творчість на рівні студії для мільйонів”,-написала прес-секретар OpenAI Кайла Вуд. “Ми тренуємося за загальнодоступними даними, що відповідають справедливому використанню та використовуємо провідні в галузі гарантії, щоб уникнути реплікації матеріалу, який вони вивчають”.
Прес -секретар YouTube Джек Малон написав у заяві, “[U]Науторизоване вискоблювання вмісту YouTube продовжує залишатися порушенням наших умов обслуговування ». У минулому році Google написав, що він використовує вміст з YouTube для розробки моделей AI таким чином, що відповідає умовам, узгодженим його творцем.
Як випробувана здатність Сори імітувати матеріал, захищений авторським правом
Напруга щодо використання генеративного ШІ в Голлівуді вибухнула в останні місяці.
У березні понад 400 директорів, акторів та зірок, серед яких Бен Стіллер, Наташа Ліонн та Таїка Вайтіті, підписали відкритий лист, що критикує Google та OpenAi за те, що він попросив адміністрацію Трампа захистити своє право на навчання на матеріалах, захищених авторським правом.
“Ми продовжуємо закликати студії, як власників авторських прав, зійти з боку і вжити заходів проти технологічних компаній, які використовують нашу людську творчість для своєї фінансової вигоди”, – заявила Мередіт Стіхм, президент Гільдії письменників Америки, яка представляє сценаристи Голлівуду.
Дісней та Універсал подали до суду на компанію AI Midjourney у червні, стверджуючи, що вона вкрала інтелектуальну власність для розробки свого інструменту для виготовлення зображень AI. У цьому місяці Warner Bros. подав скаргу на порушення авторських прав на його відеоконтент проти Midjourney.
Midjourney не відповів на запит про коментар. У своїй юридичній відповіді на Дісней та Універсал, компанія цитувала останні справи, подані проти META та антропіки, в яких судді заявили, що використання даних, захищених авторським правом для навчання AI, було справедливим використанням. У антропічній справі компанія заплатила 1,5 мільярда доларів за врегулювання судового позову, поданого видавцями та авторами книг.
Джефф Кацин, партнер компанії Management Consulting Firm Bain & Co., яка консультувала кіностудія Lionsgate у своєму партнерстві з AI Start-Runway, першою подібною угодою, заявила, що студії все частіше звертаються до вигоди від витрат і швидкості, пропонованих AI Video, але “захист IP залишається першочерговим занепокоєнням”.
Позови проти компаній AI з голлівудських правознавців можуть бути рідше, оскільки відео інструменти AI ще не конкурентоспроможні з тривалими високоякісними професійними постановоками,-сказав Джеймс Гріммельманн, професор юридичного університету.
Технологічні компанії, які володіють такими платформами, як YouTube, Tiktok та Instagram Здається, утримався від серйозних заходів проти вискоблювання. Малон, прес -секретар YouTube, заявив, що компанія вкладає інвестиції для виявлення та запобігання вискоблювання, “аж до блокування доступу від тих, хто скребла”.
Прес -секретар META Даніель Робертс заявив, що компанія застосовує цілісний підхід до боротьби з вискоблюванням і вказала на публікацію в блозі з 2021 року.
Юридична невизначеність створила ситуацію, коли менші компанії та проекти AI живуть, боячись подати позов, в той час як “великі гравці мало страждають від жодних наслідків”, – сказав незалежний дослідник AI Аран Комацузакі.
Стелла Бідерман, виконавчий директор некомерційного науково -дослідного інституту Eleutherai, заявив, що ситуація знизила прозорість. “Чистий ефект від усього цього полягає в тому, що, в основному, ніхто не говорить про те, що є в їхніх навчальних даних. Немає публічного стану мистецтва”, – сказала вона.
OpenAi, як видається, перевіряє межі справедливого використання у квітні, сприяючи здатності Chatgpt скопіювати стиль студії Ghibli, знакового японського анімаційного будинку.
Коли зображення Ghibli-Ims затопили соціальні медіа, генеральний директор OpenAI Сем Альтман опублікував на X, що Chatgpt підписав мільйон користувачів всього за годину. У той час компанія заявила, що продовжує запобігти генерації зображень, що імітують індивідуальних живих художників, але дозволяли копіювати “ширші стилі студії”.
Якщо мільйони користувачів чатгпта весело грали з ретельно виготовленою естетикою Ghibli, “слід [the studio] справді робити нульовий відсоток? ” -сказав актор Джозеф Гордон-Левітт, який провів голосову роботу для студії Ghibli.
Альтман неодноразово говорив, що художникам слід компенсувати, якщо система AI створить щось у своєму стилі. “Люди повинні отримати оплату”, – сказав він ведучого подкасту Лексу Фрідману в 2024 році. Вуд, прес -секретар OpenAI, відмовився коментувати, чи компанія досягла успіху в такій програмі.
Сцу Ю Чен сприяв цьому звіту.