Ажиотаж в Китае вокруг ИИ-видеосервисов — тревожный сигнал для всего мира

Логотип компании
15.08.2024
Ажиотаж в Китае вокруг ИИ-видеосервисов — тревожный сигнал для всего мира

Изображение создано нейросетью

Кэтрин Торбек, эксперт Bloomberg Opinion, воспользовалась нашумевшими китайскими ИИ-сервисами создания видео по текстовому описанию Kling и Vidu. Результат не вдохновил журналистку.

Китайские технологические компании бешеными темпами совершенствуют инструменты искусственного интеллекта, которые могут превращать текст в короткие видеоролики. «Выпуск нескольких сервисов по созданию видео на основе ИИ от крупных компаний и стартапов направлен на то, чтобы показать, как страна сокращает разрыв с США в области технологий. Но одновременно они открывают ящик Пандоры…», полагает эксперт.

Кэтрин Торбек попробовала работать с несколькими сервисами: «Они не позволили мне создать видео с брейк-дансом Си Цзиньпина, но один из них создал клип по моему портрету, на котором я сняла куртку и рубашку… Мне ... стало жаль поколение молодых людей, которые растут с этой легкодоступной технологией».

Журналистка отмечает, что большинство созданных видео были очень «странными», над сервисами необходимо еще работать и работать:

«Моим любимым творением стала реалистичная серо-полосатая кошка, поедающая миску рамена в открытом космосе от Kling (запрос: «Можете ли вы сделать реалистичное видео серо-полосатой кошки, поедающей рамен в открытом космосе?»), но ИИ добавил жуткую человеческую руку, чтобы помочь котенку есть лапшу палочками. Vidu дал мне невероятно реалистичный кадр пары влюбленных в стиле легендарного режиссера Вонга Кар-Вая, но зачем-то удалил одежду (выше плеч) на моем собственном снимке. Когда я попросила Kling убрать мою куртку и рубашку с фотографии, он ничего не сделал».

Ажиотаж в Китае вокруг ИИ-видеосервисов — тревожный сигнал для всего мира. Рис. 1

За последние недели интернет-гигант Kuaishou Technology выпустил свой инструмент для создания видео на основе ИИ Kling; стартап Zhipu AI запустил Ying; материнская компания TikTok ByteDance Ltd. представила Jimeng; а стартап Shengshu AI при поддержке Университета Цинхуа запустил Vidu. Сообщается, что Alibaba Group Holding Ltd. также работает над собственным приложением для создания видео на основе ИИ.

Kuaishou заявили, что планируют использовать Kling для создания короткометражного фильма в жанре фэнтези, но сомнительно, что это будет что-то качественное, инструмент очень несовершенен. «Созданный мною клип с девушкой, танцующей брейк, был кошмарным. Анимационное видео, которое я сгенерировала, имело красивый фон, но там была летающая непонятная фигура. Мне также потребовалось около пяти минут, чтобы сгенерировать пятисекундный клип, так что представьте, сколько часов ушло бы на создание более длинного видео, не считая кропотливого пост-обработки и монтажа», считает эксперт.

Желание поскорее предложить эти сервисы китайской публике резко контрастирует со стратегией американских компаний. OpenAI анонсировала Sora в феврале, но пока не выпустила его. Veo от Google в настоящее время доступен только тестировщикам.

«..сдержанность американских технологических гигантов в запуске этих инструментов мудра (и экономит им массу вычислительных ресурсов). Но это также затрудняет оценку того, насколько их продукты на самом деле превосходят китайские аналоги. Согласно анонсам, которые мы видели от OpenAI и Google, они кажутся гораздо более способными создавать реалистичный видеоконтент».

Обучение видеомоделей ИИ требует огромных объемов визуальных данных и вычислительной мощности. Опубликованное исследование OpenAI по Sora показало, что качество видео «заметно улучшается» по мере увеличения вычислительных ресурсов для обучения.

Пекину в настоящее время ограничен доступ к первоклассному оборудованию от Nvidia Corp. и других компаний. Но китайские технологические компании находят способы получать эти продукты через сложные серые рыночные маршруты, а также занимаются производством ИИ-чипов ИИ самостоятельно. Интересно, насколько более мощными станут их видеосервисы и разработки ИИ через пять-десять лет?

Ажиотаж в Китае вокруг ИИ-видеосервисов — тревожный сигнал для всего мира. Рис. 2

Одни утверждают, что видеогенераторы ИИ демократизируют творчество, давая любому человеку возможность снимать собственные фильмы. Но непрозрачные данные обучения поднимают вопросы о правах интеллектуальной собственности и о том, как это может повлиять на заработки профессиональных создателей. Существуют также вполне обоснованные опасения, что обязательно найдутся мошенники, которые будут злоупотреблять ИИ-видеосервисами, создавая дезинформацию и даже фейковую порнографию.

«Между тем, настроения по всему миру ухудшаются в отношении контента, созданного ИИ. Некоторые из первоначальных «вау-факторов», испытанных после выпуска ChatGPT почти два года назад, превратились в усталость, и теперь возникают вопросы о том, как эта технология трансформируется во что-то, что сделает нашу жизнь лучше.

Возможно, уже слишком поздно загонять джинна обратно в бутылку, но поколение, которому приходится взрослеть под постоянной угрозой быть обманутым, заслуживает лучшего».

Читайте также
О том, в какой мере уход западных вендоров трансформировал рынок компьютерной техники, почему без полной локализации производства сегодня не обойтись и как отвечать потребностям заказчиков в современных условиях, IT-World рассказывает Антон Громов, вице-президент «Рикор» — одного из крупнейших в РФ производителей компьютерной и серверной техники.

Источник: www.bloomberg.com

Похожие статьи