ТЕХНОЛОГІЇ

Замінити обличчя (вже) заборонених акторів і зекономити. Як штучний інтелект змінює кіно, рекламу та креатив

20 Листопада 2022, 12:35
7 хв читання
Матеріал успішно додано в закладки Досягнуто максимальної кількості закладок
Додати в закладки

Будь-яку статтю можна зберегти в закладки на сайті, щоб прочитати її пізніше.

Режим читання збільшує текст, прибирає все зайве зі сторінки та дає можливість зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.
Режим читання

Режим читання збільшує текст, прибирає все зайве зі сторінки та дає можливість зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.

Режисери «редагують» стрічки за допомогою діпфейків. Кіногероїв озвучують нейромережі, що імітують людський голос, обкладинки світових журналів малюють text-to-image моделі. 2022 рік сміливо можна назвати розквітом Generative AI — тієї галузі штучного інтелекту, що самостійно навчається для створення нових зображень, відео, аудіо, тексту чи коду. 

Рубікон пройдено — це вже не пуста вау-бульбашка, а повноцінний інструмент. Він розширює можливості компаній, продакшн-студій, рекламних агенцій та й потенційно будь-якого бізнесу. 

Керівник департаменту досліджень та інновацій Film.ua Group Євген Санніков, як ШІ змінює правила гри для всіх, хто займається створенням візуального контенту. 

Більше креативу

Як працюють алгоритми text-to-image, які не сходять з вуст цього року? Штучний інтелект, грубо кажучи, створює пари «текст + зображення», використовуючи картинки у вільному доступі. Для цього він невпинно навчається, щоб на запит «білий пухнастий кіт» дійсно видавати відповідне зображення. 

Це дуже складна та масштабна робота: на «тренування» тієї ж DALL-E, за приблизними оцінками, пішло від кількох сотень тисяч до кількох мільйонів доларів. 

Інша модель (у випадку з DALL-E це CLIP) вивчає мільйони зображень та підписів, щоб з’ясувати наскільки вони «підходять» одне одному. Принцип тренування базується на тому, щоб модель максимізувала для себе схожість однієї пари зображення та тексту та водночас мінімізувала схожість інших. 

На перший погляд здається, що це не більше, ніж іграшка: покрутив, помалював і забув. Але після використання сервісів можна сміливо сказати, що алгоритми працюють. Ба більше — вони видають результат, який можна використовувати у серйозних проєктах. 

Зараз у Film.ua ми працюємо над документальною стрічкою про Станіслава Лема — видатного польського письменника-фантаста, що народився та виріс у Львові. Ми хочемо робити кіно з акцентами на візуальній складовій, тому потребуємо багато арт-ворків. 

Коли я почав збирати презентацію для пітчу, використав сервіс Midjourney — програму, що використовує штучний інтелект для генерації зображень за текстовими запитами. Це бот у месенджері Discord, де користувач надсилає опис та отримує оригінальну картинку. 

Я побачив, що алгоритм дуже добре вловлює суть, стиль та ідею. Можна зловити притаманні творам Лема планети, сонячне світло, масштаби, пропорції. Це не просто «картинки» про космос, а, якщо можна так сказати, вдумливі роботи з урахуванням контексту. 

Кожна людина — у якомусь роді нейромережа. Коли дизайнер працює над проєктом, він використовує власний досвід, стиль, побачене раніше. Штучний інтелект — це синтез усієї візуальної культури людства за тисячі років. Тобі буквально доступно все світове мистецтво. Використання алгоритмів — як «Вікіпедія»: ти можеш не знати всього, але знати, як це знайти та відтворити. Зрештою, креатив виходить потужнішим та більш варіативним. 

Text-to-image насправді можна використовувати будь-де, де потрібна візуальна складова: від ілюстрування дитячих книжок до створення іконок та рекламних кампаній. 

Наприклад, нещодавно ми разом з ВДНГ зробили новий кампейн «Експоцентру», згенерувавши віжуали його головних локацій. Використовували стиль відомих художників — і ШІ відмінно «зчитав» манеру Мане, Матісса, Ренуара, Руссо, Малевича та інших. 

Швидкість та оптимізація 

Нові сервіси значно пришвидшують процес створення зображень. Наприклад, віжуали для презентації документального фільму про Станіслава Лема я зробив за пів години. І це лише один з багатьох прикладів, як штучний інтелект уже зараз може економити час та, відповідно, гроші. 

Раніше запускався один проєкт з рецептами української кухні. Для нього потрібні були ілюстрації — інгредієнтів, посуду тощо. Як завжди, до цього долучили ілюстраторку: поставили завдання, обговорили стиль. А потім чекали на зображення лише одного інгредієнта два тижні. 

Це не те щоб стандартна ситуація, але з людьми, що працюють з образами та творчими формами, таке трапляється. Терміни підтискали, тому я вирішив спробувати text-to-image алгоритм — і буквально за годину отримав декілька десятків картинок інгредієнтів у гарній якості та єдиному стилі. Після цього продюсерка вирішила продовжити співпрацю з ШІ.  

Такі ситуації будуть траплятися й далі. На відносно простих та об’ємних проєктах штучний інтелект, що видаватиме результат за лічені години і «братиме» до $30 на місяць, буде банально ефективнішим. Втім я би поки не говорив про конфронтацію ШІ та людини: для вправної роботи алгоритмів потрібна візуальна «база» — а її створюють саме люди. 

Простір для маневру

Цього року з’явилася історія, як творці фільму Fall використали діпфейки, щоб замінити нецензурні вислови у фільмі на нейтральні — і в такий спосіб зорієнтувати стрічку на масову аудиторію. Причина рішення була простою. Продюсери та режисер не могли дозволити собі перезнімати усі сцени через велику вартість, а штучний інтелект впорався із завданням швидше та за значно меншу ціну. 

Схожа історія є і в українській кіноіндустрії. У наших продакшн-студіях останні роки є особливість: на «полицях» лежить велика кількість стрічок.

Їх не можна випускати в ефір через акторів, що потрапили до «чорних списків» Мінкульту — «осіб, що створюють загрозу нацбезпеці», зокрема через підтримку російської агресії. 

Перезнімати такі фільми — велика проблема: це час, бюджети, ресурси. Тому ми в Film.ua почали «змінювати» героїв саме завдяки діпфейкам. Жодного додаткового фільмування, монтажу — лише новий актор, алгоритми та певний час. Це дає таким студіям та компаніям, як наша, нові можливості — для внесення змін чи вдосконалення сцен уже після основного етапу створення фільму в інструментах постпродакшну. І, звісно, це сильно оптимізує бюджет. Ось, наприклад, демонстраційна версія використання діпфейку в серіалі «Метелики». 

Я впевнений, що для компаній та студій, які займаються створенням відеоконтенту, штучний інтелект — не тільки діпфейки — стане повноцінним інструментом. Наприклад, уже зараз є алгоритм Disco Diffusion, що «домальовує» бажані елементи та анімує зображення чи відеоуривки за допомогою ШІ. Завдяки йому ми, наприклад, зараз робимо заставку для нового проєкту — і вражені як якістю, так і зручністю. 

Знайшли помилку? Виділіть її і натисніть Ctrl+Enter

Завантаження...