OpenAI объявляет закрытие Sora, приложения для создания видео, чтобы упростить свои продуктовые предложения и перераспределить вычислительные ресурсы на другие стратегические проекты. (Фото: Самуэль Буавен/NurPhoto через Getty Images)
NurPhoto/NurPhoto через Getty Images
Ранее на этой неделе OpenAI подтвердил закрытие своего приложения для потребителей Sora, добавив, что это часть более крупного перераспределения своих ресурсов на другие проекты по мере увеличения потребления вычислительных мощностей.
Хотя решение, принятое всего через три месяца после того, как Disney согласился инвестировать $1 миллиард в OpenAI и лицензировать некоторых своих персонажей для Sora, показалось внезапным, более внимательное изучение экономики видеогенерации дает некоторые ответы. OpenAI также движется к предстоящему IPO, поэтому требуется более строгий взгляд на его денежные потоки.
Первоначальное привлечение потребителей Sorа было сильным: ежемесячные загрузки в App Store достигли пика в ноябре более 3,3 миллионов. Но к февралю загрузки упали до примерно 1,1 миллиона, сигнализируя о низкой удерживаемости пользователей, согласно мобильной фирме Appfigures. OpenAI не ответил на запрос PitchBook.
Для наблюдателей индустрии Sora, казалось, полагался на новизну, чтобы привлечь пользователей, но не смог понять, как удержать их.
Модели, подобные Sora, потрясающи, но они медленно генерируют видео, — сказал Альберто Тайути, бывший технический директор стартапа по видеомоделям ИИ Luma AI, который сейчас создает Reactor, стартап на стадии скрытой разработки, работающий над видео-ИИ в реальном времени. Поэтому люди, не являющиеся полными энтузиастами, не будут вовлечены.
В то же время, затраты на поддержку Sora были значительными. OpenAI в основном субсидировала запросы, чтобы привлечь больше пользователей на платформу. Forbes оценивал, что компания тратила $15 миллионов в день на свой продукт генерации видео с помощью ИИ только в течение некоторого времени в прошлом году.
Поскольку каждое изображение в кадре обрабатывается индивидуально, генеративное видео в настоящее время в разы дороже, чем модели на основе текста. Как минимум, каждая секунда в 60 раз дороже, чем запуск одной модели изображения, что само по себе дороже голоса, — сказала Эйлюль Кайин, партнер Gradient Ventures.
Передача полной стоимости вывода на потребителя представляет собой сложное предложение. В конце дня, просто включение одного Nvidia H100 стоит примерно $2 в час. Для вас, обычного пользователя, это все равно может быть дорого, согласно Майклу Лингельбаху, сооснователю стартапа по генерации видео с помощью ИИ Hedra.
Тем не менее, многие стартапы по генерации видео достигают значительных показателей денежных потоков с помощью аналогичных крупных моделей, ориентируясь на предприятия, что указывает на путь к коммерческому успеху в данной категории.
Mirage, стартап по генерации видео с помощью ИИ, ранее известный как Captions, берет плату за стоимость вывода и абонентскую плату в $10 в месяц. Текущие денежные потоки положительны, согласно основателю Гаураву Мисре, и Mirage закрепил новые $75 миллионов инвестиций от General Catalyst именно на этой неделе.
Наша модель почти такого же размера, как Sora, поэтому стоит примерно столько же, что дорого, — сказал Мисра, который все больше рекламирует Mirage для предприятий и малых бизнесов, чтобы найти пользователей, готовых больше платить.
Hedra, которая в прошлом году привлекла $32 миллиона в раунде серии A под руководством Andreessen Horowitz, также ориентировала себя на предприятий заказчиков. За менее чем два года ее потребности в вычислениях выросли более чем в 300 раз, и тем не менее стартап сейчас работает с положительным чистым доходом, согласно Лингельбаху, генеральному директору стартапа.
На нашем сайте мы не теряем деньги на ни одной из наших моделей, — сказал Лингельбах.
Hedra предлагает более интенсивную по вычислениям модель Omnia для крупных предприятий, и более дешевую модель на основе аватаров для малых бизнесов, ищущих ИИ-видео для передачи простых сообщений, таких как учебные видео.
Разделяя своих клиентов на различные группы, как Mirage, так и Hedra перераспределяют вычислительные ресурсы на ценовые точки отдельных клиентов, позволяя им продолжать работу, пока стоимость вычислений для мультимодальных систем не снизится, не покидая корабль.
И с более дешевыми вычислениями и массовым спросом на генеративные 3D миры в перспективе, основатели и инвесторы ожидают, что звезды станут соответствовать генерации видео с ИИ в масштабе в 2026 году.
Мы абсолютно уверены, что у нас будет как минимум в 100 раз больше улучшений [в стоимости] в следующем году, году и полтора, — сказал Тайути. Независимо от того, сколько стоит сегодня, я думаю, что ошибочно слишком сильно беспокоиться об этом.
Этот материал изначально появился на новостном портале PitchBook



