Бум на нейросети, несмотря на затишье, никуда не исчез. По-прежнему появляются новые, интересные ИИ-сервисы, облегчающие работу и творчество в разных сферах. В статье рассказываем о новинках этой осени, которые пригодятся при создании различных креативов — не только в арбитраже трафика, но и в творческой жизни.
HeyGen — генеративная нейросеть от компании OpenAI для распознавания в видео речи и перевода ее на другой язык. Это не основная функция сервиса, но именно благодаря ей HeyGen стал популярен.
Основанная пару лет назад Джошуа Сюй и Уэйном Ляном, платформа под названием Movio предназначалась для создания видео с AI-аватарами и наложенными голосами. Эта концепция сохранилась, только позже добавили инструменты озвучивания текстов на разных языках, распознавания голоса и создания дипфейков с сохранением мимики персонажа. В сентябре 2023 года уже под названием HeyGen разработчики представили расширенную по функционалу бета-версию.
Возможности перевода и озвучивания на русском пока нет, но с русского на другие языки переводить можно.
Также пользователи получают следующие возможности:
Начать работу с видео можно бесплатно, кликнув по кнопке «Try HeyGen for Free», после чего нужно создать емейл-аккаунт или авторизоваться с помощью Google, Facebook* или системы единого входа Single Sign-On.
Интерфейс дашборда HeyGen прост и незамысловат, все названия меню интуитивно понятны даже для плохо владеющего английским человека. В верхней части располагаются четыре активных меню, с помощью которых можно создать аватар или сгенерировать видеокреатив — Instant Avatar, Photo Avatar, Template, AI Script.
Основная работа с видео ведется в меню Template. При клике на команду на экране появляются форма для создания горизонтального/вертикального видео. Одновременно можно выбрать формат ролика — рекламный, презентационный, новостной, коммерческий и так далее. После выбора основных настроек сервис перенаправляет во встроенный видеоредактор для работы с конкретным роликом. Здесь можно выбирать варианты перевода, загружать собственные аудиоскрипты, добавлять паузы и пользоваться другими способами монтажа, в том числе с помощью ИИ.
Преимущество HeyGen в том, что тут есть множество дополнительных инструментов работы с голосом и визуалом. Например, команда Clone voice позволяет дублировать собственный голос на все основные языки AI-сервиса. Функционал TalkingPhoto помогает «оживлять» статичные фото, что удобно при создании анимированных аватаров. Также HeyGen дает возможность при помощи облачной платформы Zapier интегрировать создаваемые креативы с сотнями приложений, систем, социальных сетей, CRM и так далее.
Бесплатная версия сервиса позволяет работать с двумя роликами по 30 секунд или с одним роликом продолжительностью в 59 секунд. На это есть два условных кредита, каждый кредит — минута сгенерированного видео.
Планы Creator и Business предлагают разное количество ежемесячных кредитов — от 15 до 300 по разным ценам. Самый дешевый вариант использования 15 кредитов плана Creator обойдется в $24 в месяц, дорогой — 300 кредитов плана Business — в $720 ежемесячно. При выборе годового тарифа действует скидка в 20%.
В HeyGen есть также индивидуальное предложение Enterprise с кастомизированным набором инструментов.
При оплате сервиса понадобится карта иностранного банка, российские карты не поддерживаются.
К плюсам сервиса относятся:
Среди минусов пользователи отмечают:
HeyGen довольно быстро стала популярной нейросетью. Особенно ее оценили блогеры и любители необычных креативов. Однако многих людей отпугивает прайс на использование: $24 в месяц на генерацию 15 минут видео — это затраты для обычных пользователей.
Русскоязычный Шедеврум от Яндекса в виде прототипа появился еще в апреле 2023 года. В первые месяцы после презентации было много критики в адрес сервиса. Однако нейросеть постоянно обновлялась, и осенний релиз представляет Шедеврум как уже полноценный инструмент для создания изображений, текста и видео.
Бесплатный AI от Яндекса работает на основе технологии каскадной диффузии: создает базовое изображение и затем постепенно добавляет на него детали, согласно заданному промпту. На выходе получаются четыре разные изображения на выбор.
С момента запуска Шедеврум задумывался как большое сообщество пользователей, которые не только могут создавать контент, но и публиковать его в общей ленте. При этом людям предлагалось оценивать и комментировать креативы, подписываться друг на друга. Таким образом, нейросеть от Яндекса фактически строит социальную сеть вокруг своего ИИ.
Летом 2023 года к Шедевруму подключили YandexGPT — языковую модель, которая генерирует текст по запросу. В августе нейросеть «научилась» склеивать несколько изображений в видеоролики.
Для создания собственных креативов приложение Шедеврум необходимо скачать из Google Play или AppStore. В браузере можно только просматривать чужие изображения и лайкать их.
Как выглядит приложение при запросе
Приложение позволяет генерировать картинки с разрешением 1024х1024, самостоятельно установить желаемое разрешение и соотношение сторон не получится. Однако в окне ввода промпта есть модифицирующие подсказки — «профессиональное фото», «реалистично», «яркое освещение», «в стиле Дали» и так далее.
Языковая модель YandexGPT при генерации текста работает так же, как и в сервисе Алиса, только в нейросети Шедеврум в обязательном порядке появляется еще и заголовок. Сразу предлагается на выбор несколько сгенерированных под текстовый запрос изображений.
При создании видео можно генерировать короткий ролик длиной в 4 секунды с частотой 24 fps. В процессе создания Шедеврум просит описать основную идею и предлагает 4 кадра на выбор. Одновременно пользователь должен определиться с типом анимации, который «оживит» кадр — таймлапс, приближение, панорама, полет, подъем, вращение или постепенное изменение рисунка. Инструменты создания видео сейчас, впрочем, доступны небольшому числу активных пользователей нейросети.
Весь создаваемый контент появляется в общей ленте, любую картинку, в том числе чужую, можно сохранить, нажав на троеточие и выбрав соответствующий пункт.
Как и в любой другой нейросети, в Шедеврум есть ограничения. Запрещены при генерации промпты с указанием конкретных личностей, упоминание политики или религии, а также эротика, насилие и жестокость. Для генерации текста нейросети требуется не более 5-10 секунд, изображения формируются в течение минуты.
После скачивания приложения на устройство нужно войти в него под учетной записью Яндекс.
На главной странице появится общая лента постов с опубликованными креативами других пользователей. Все записи можно отсортировать по дате или популярности, в режиме подписки показываются только посты авторов, на которых оформлена подписка.
Для создания креатива нужно кликнуть на кнопку с «+» в нижней части приложения, после чего выбрать пункт «изображение» или «текст». В появившемся окне нейросеть предлагает написать запрос для изображения или текста. При клике на знак вопроса появляются подсказки, которые можно листать пальцем влево.
В случае, если полученный креатив не нравится, можно нажать на кнопку «Перегенерировать» и уточнить запрос в поле редактора промпта. Неудачные изображения удаляются при клике на иконку «Корзина».
К плюсам популярной нейросети от Яндекса относится:
Недостатки Шедеврума:
Социально-творческий замах Шедеврума неплохой: сервис предлагает людям соцсеть с возможностью генерации креативов в трех форматах. Но объективно: пока что AI от Яндекса отстает в качестве получаемых изображений от русскоязычного аналога Kandinsky от Сбера и тем более от популярнейшего Midjourney. Тем не менее это единственный на осень 2023 года многопрофильный ИИ-сервис в Рунете с довольно простым инструментарием.
Runway Gen-2 — это нейросеть для генерации видео от разработчиков популярной Stable Diffusion, сервиса, который позволяет генерировать качественные изображения разных форматов, в том числе реалистичные.
Первая версия AI-видеоплатформы позволяла преображать исходные изображения и загруженные ролики, в обновленной версии можно создавать видео по текстовому запросу с нуля.
Сервис дает возможность создавать профессиональные, иногда весьма реалистичные ролики. Из дополнительных функций можно выбрать наложение маски, добавление стилизации под задаваемый шаблон. Среди инструментов также есть раскадровка, рендеринг и кастомизация.
Особенность сервиса в том, что сгенерированные видео на бесплатном тарифе не превышают 4 секунд по продолжительности, а сами запросы не могут быть длиннее 320 символов. На платных тарифах длина видео увеличивается до 15 секунд.
Пользоваться Runway Gen-2 можно как в браузерной версии, так и приложении под iOS.
В браузерной версии для регистрации нужно кликнуть Try runway for free, после чего создать аккаунт или авторизоваться через Google, Apple-аккаунт или Single Sign-On.
Интерфейс дашборда интуитивно прост и понятен. Слева расположена панель инструментов, среди которых меню для создания видео, изображений и 3D-объектов. В центральной части собрано несколько кнопок с основными инструментами — генерации ролика с загруженной картинки-референса, видео или текстового промпта. Популярные инструменты также вынесены в отдельную панель с иконками.
В нижней части экрана в разделе Discover and Remix размещены расположенные плиткой примеры вдохновляющих роликов.
Для создания видео нужно выбрать меню «Start with Image» или «Start with Text», после чего необходимо ввести в поле «Text» запрос. В поле «Image» выбирается картинка для референса, а через меню «Image+Description» к иллюстрации-референсу добавляется текстовое описание.
При клике на иконку дополнительных настроек открываются команды:
В настройках Runway Gen-2 также есть инструменты детального редактирования:
В бесплатной версии сервис предлагает 125 кредитов для трех проектов общим размером до 5 Гб без возможности удаления вотермарок. Одна секунда генерации равна 5 кредитам.
Тариф «Standard» стоимостью $12 в месяц или $144 в год открывает дополнительные возможности: 625 кредитов для неограниченного числа проектов с общим размером видео до 100 Гб.
Тариф «Pro» стоимостью $28 в месяц или $336 ежегодно открывает еще больше возможностей — 2 250 кредитов при загрузке видео на 500 Гб, а также ряд дополнительных опций при редактировании и экспорте роликов.
Тариф «Unlimited» по цене в $76 в месяц и $912 в год позволяет снять все ограничения в редактировании, бонусом даются ежемесячно возобновляемые 2 250 кредитов.
К плюсам нейросети относится:
Среди минусов Runway Gen-2 пользователи отмечают:
Чтобы использовать Runway Gen-2 полноценно, нужно перейти хотя бы на стандартный тариф. Это позволит более или менее свободно экспериментировать с видео, получая в результате приближенный к задумке вариант ролика. В целом, сервис по уже реализованному функционалу смотрится солидно.
GigaChat bot — это нейросетевой чат-бот от Сбербанка, недавно запущенный в Telegram.
Свой фирменный AI-сервис в Telegram крупная российская корпорация презентовала в апреле 2023 года. Спустя полгода по просьбам пользователей она реализовала идею в популярном мессенджере. Сервис до сих пор находится в бета-тестировании, хотя открыт для всех.
Нейросеть задумывалась разработчиками Сбера, как полноценный сервис, способный в перспективе конкурировать с ChatGPT. Функционал у него довольно обширный:
Многофункциональность GigaChat обеспечена его мультимодальным нейросетевым ядром на базе созданной модели NeONKA. Сама NeONKA состоит из нескольких модулей:
В отличие от официальной браузерной версии GigaChat, требующей авторизации с помощью Сбера ID, бот в Telegram доступен для всех зарегистрированных в мессенджере пользователей.
Чтобы начать работу с ботом, нужно кликнуть по кнопке «Запустить». GigaChat bot открывает несколько команд:
Через меню чат-бота доступны дополнительные управляющие команды:
К плюсам бота относится:
Среди недостатков сервиса можно выделить:
Логические и фактические ошибки в ответах. Пользователи отмечают, что при специфических запросах алгоритм нейросети начинает путаться и выдавать неверные ответы. Чаще всего ошибки возникают при запросах программного кода;
Жесткие алгоритмы фильтрации при запросах. Эксперименты пользователей с ботом показывают, что нередко алгоритм маркирует в качестве запрещенных тем довольно невинные запросы, хоть и хитро сформулированные. Таким образом, получить бан в GigaChat bot можно в течение нескольких минут, и обойти его не получится — для дальнейшей работы ИИ отправляет в официальную браузерную версию.
GigaChat bot от Сбера по функционалу не уступает официальной браузерной версии, но сохраняет несовершенство бета-версии, воспроизводя ошибки и логические нестыковки в ответах. И хотя разработчики заявляют о стремлении приблизиться к идеалу англоязычной AI-модели ChatGPT, очевидно, что работы на этом пути предстоит еще немало.
*запрещенная в РФ организация