Нейросети занимают все больше ниш и применяются во всех возможных областях. Сейчас при упоминании нейросетей многие думают о всяких несерьезных вещах по типу «сделать смешную картинку по текстовому запросу». Но на самом деле — это не все, на что они способны.
Будьте в курсе последних новостей партнерского маркетинга, статей, руководств и тематических исследований. Подпишитесь на наш Telegram канал сегодня!
Нейронки продвинулись гораздо дальше и сейчас показывают отличные результаты в озвучке, создании логотипов, редактировании видео и фото, создании и анализе текста для копирайтеров или маркетинга. Их даже используют для прохождения видео-верификаций в Букмекерских Конторах, банках и криптобиржах, о чём мы писали ранее в нашем Telegram-канале про беттинг:
Дипфейки можно даже использовать для того, чтобы посадить старушек вести под видом молодых девушек стримы в азиатских стриминговых приложениях:
Мы запускаем новую рубрику, где будем рассказывать о полезных и интересных программах и сервисах, которые работают на базе искусственного интеллекта (ИИ). В этой статье мы покажем вам, насколько разнообразен мир нейросетей, и разберем недавний скандал вокруг стартапа Kaedim, который обвинили в применении ручной силы при превращении 2D объектов в 3D.
На более чем 15-и кейсах мы разберём, какие программы на базе ИИ существуют, а также расскажем, как их эффективно применять манимейкерам.
Нужны проверенные акк для соцсетей? Найдете их у нас в разделе Аккаунты.
Это программа на основе нейронной сети, которая превращает 2D-концепты в полноценные 3D-модели за 15 минут с хорошей топологией.
Добиться хорошей правильной топологии сложно, если мы говорим о том, что это делает машина, а не человек. Тем более, разработчики на своем сайте говорят о том, что преобразовать можно любую картинку, будь это простая рисовка или сложная реалистичная фотография. Так много вопросов и так мало ответов. Ответов и правда мало, потому что разработчики отмалчиваются о том, как им это удается, и ссылаются на невероятную обученную нейронную сеть.
Пользователи начали что-то подозревать и попытались раскрыть тайну Kaedim. Самый первый вопрос, которым они задались — это то, как машине удается так сильно упрощать детали в готовой 3D-модели. Посмотрите на птицу, которую прогнали через Kaedim. Куда пропали все перья, неровности?
Вопросов бы не возникло, если бы объект на реалистичном фоне с множеством мелких и лишних деталей не лишался их в готовом варианте, превращаясь в упрощенную версию самого себя. Нейронные сети можно много чему обучить, но вот как правильно отсекать лишнее и по какому принципу это лишнее отбирается — научить машину сложно. Это может сделать только человек. Даже если это делает нейронка, то такой конечный результат ну никак не получится, какая бы безупречная топология ни была. Причём при загрузке изображения, можно указать то, что должно получиться. Технология, опережающая годы? Сомнительно.
Пользователи Twitter обратились за разъяснениями к аккаунтам @Forbes и @80Level, которые написали о Kaedim в своих изданиях, и попросили рассказать, видели ли они лично от начала и до конца то, как происходит процесс преобразование из 2D в 3D. Ответа не последовало, и тогда они начали разбор в комментариях.
Позднее один из пользователей обнаружил старую вакансию, в которой Kaedim искала сотрудников для «быстрого преобразования 2D-исходников в 3D-объекты низкого качества за 15 минут».
Пользователи Twitter предположили, что уникальный искусственный интеллект — это специалисты из стран третьего мира, условные индусы, которые «клепают» 3D-модели по $1 за штуку. И такое предположение действительно ставит все на свои места.
Сравнивая стоимость подписки на данный ресурс с похожими проектами в сфере, можно сказать, что цена откровенно завышенная. Полноценная подписка начинается от $299 в месяц за 30 моделей и доходит до $7 700 за 1 000 моделей. Пробная версия стоит $6 за один проект.
Многие пользователи, которые, по их словам, много лет занимаются 3D-моделированием, в комментариях утверждают, что этот проект — чистое мошенничество.
Одним из аргументов стало то, что если бы им действительно удалось разработать нейронную сеть, способную самостоятельно превращать 2D-объекты в 3D, то такая технология попросту стала бы прорывом, как известный Google.
Через 2 дня команда Kaedim наконец решила дать публичные разъяснения. Помимо тезисов о честности и прозрачности их работы, они раскрыли процесс обработки изображений, который всех так интересовал:
Сначала ИИ обрабатывает исходное изображение и преобразовывает его в 3D-модель, а затем инженер проверяет, насколько хорошо нейронка сделала свою работу. И, если это нужно, человек редактирует модель «в соответствии с высокими стандартами качества Kaedim».
Это имеет смысл, но все-таки остается вопрос, а к чему вообще это ручное редактирование? Почему бы просто не дать пользователям неидеальный результат, но зато полностью сделанный ИИ? Со временем нейронная сеть обучалась бы и качество ее работы стало выше. По этому принципу развивались все самые успешные нейронные сети, типа DALL-E и Midjourney.
Умеете работать с нейросетями? Предложите свои услуги у нас в разделах с резюме и фрилансерами.
Интересно, что в августе 2022 основательница сервиса Kaedim Константина Псома дала интервью Forbes, в котором сделала несколько громких заявлений, с которых пользователи только посмеялись. Например, «создание 3D-ассетов — одна из наиболее трудоемких частей процесса разработки игр». Или вот это: «игровая индустрия печально известна своим кризисом и нарушением сроков. Сколько раз ваша любимая игра откладывалась? С помощью инструмента Kaedim, разработчики игр могут создавать игры в 10 раз быстрее, а это означает, что за то же время, что вы сейчас ждете одной игры, будет выпущено десять игр».
Основная аудитория сервиса — игроделы. Но подобные высказывания говорят о том, что предпринимательница либо намеренно вводит читателей в заблуждение, чтобы прорекламировать свой стартап, либо сама не разбирается в данной сфере. Что уж говорить, если Константина считает метавселенные — «ребрендингом игр», а сиквелы популярных проектов выпускают долго потому, что «не могут использовать 3D-модели, использовавшиеся в предыдущих играх, которые были сделаны много лет назад, так как они теперь неуместны».
Несмотря на заявления выше, в интервью есть всё-таки один интересный факт: предпринимательница рассказала, что ее команда выпустила API, с помощью которого любой желающий может интегрировать автоматическое преобразование 2D в 3D в свои приложения, игры и метавселенные.
Является ли Kaedim скамом или нет — до конца непонятно. Но большинство пользователей Twitter, которые протестировали нейронку, склоняются к первому варианту.
Ранее мы уже упомянули несколько других нейросетей, которые действительно существуют и их уже можно «пощупать». Поэтому переходим к подборке интересных нейросетей и кейсов, где эти сервисы применялись на практике.
Самая популярная нейронная сеть для создания дизайна ушла далеко в будущее и сейчас дает потрясающие результаты. DALL-E 2 создает не только красивые и точные изображения по текстовому запросу. Нейросеть создает логотипы, дизайны упаковок, анимации и дорисовывает изображения, с помощью функции OutPainting, сохраняя стиль и смысл. Вот несколько кейсов с применением этой нейронки, которые впечатлят вас.
DALL-E 2 может легко сгенерировать множество элементов в едином стиле, вот пример того, как можно сделать иконки для вашего веб-сайта, приложения или чего угодно.
Нейронка настолько успешно справилась с этой задачей, что невольно задаешься вопросом: а нужны ли вообще дизайнеры? Цветовая гамма и стиль подобраны хорошо, и плюс к этому, если вам захочется что-то изменить, то нужно просто дополнить запрос для нейросети и добиться идеального результата.
С помощью нейросети DALL-E 2 можно существенно облегчить разработку ландшафтов, персонажей и предметов. Разработчик создал игру, в которой нейросеть сгенерировала фоновые элементы, окружение и даже анимации.
Результат получился очень симпатичный, особенно если учесть, что нейросеть работает не так давно. В дальнейшем ИИ будет развивать свои умения. Можно только представить, какой результат нас ждёт в будущем.
Это ещё более развитая популярная нейронная сеть, которая создает изображения по текстовому запросу. Она выдает просто восхитительные картинки, хоть и делает это более абстрактно и «лампово», чем DALL-E 2. В Midjourney можно сделать всё, что угодно: логотипы для бизнеса, дизайны упаковки, которые покажем ниже, дизайн игр, клипы и многое другое.
Кондитерская «Тортишная» из Кемерово сделала дизайн для плиток шоколада с помощью Midjourney, и результат получился волшебным.
Они обычно прибегали к услугам дизайнеров, но в этот раз решили пойти другим путем и разработать упаковку с помощью нейросети. Результат получился интересным и необычным, но, как говорят представители кондитерской, на это ушло гораздо больше времени, чем если делать дизайн вручную. В заключение они добавили, что это было весело, но в следующий раз они не воспользуются нейросетью для создания упаковки, а отдадут работу дизайнерам.
Вот второй пример разработки упаковки, на этот раз для попкорна. Такой результат выдала нейронка спустя одну минуту.
Выглядит здорово, но проблема в том, что это просто изображения дизайна, а не шаблон, который можно пустить в печать. Тем не менее это может послужить идеей для дальнейшей разработки, что уже неплохо.
Как и в примере с нейронкой DALL-E 2, с помощью Midjourney можно создавать дизайн для игр. Вот один из таких примеров, где разработчик 2D-игры под названием Shoon, использовал ИИ для генерации постапокалиптического пейзажа для фона, моделей летательных аппаратов и странных существ в игре.
Если в дополнение к этому сгенерировать код в Copilot или в AlphaCode (эти сервисы, кстати хвалят программисты, но не как «заменитель» кодеров, а как помощников), а фоновые звуки и физику благодаря ИИ, тогда получится создать игру почти полностью только нейронными сетями.
Midjourney создает удивительно сложные пейзажи и картины. Они получаются настолько необычными, что действительно могут соперничать с работами художников. Возможно, в дальнейшем стоит ждать новое ответвление современного искусства, ведь искусство отражает реальность, а реальность — это нейросети.
Вот интересный пример того, как американский художник занял первое место в категории «цифровое искусство» в конкурсе, который проходил на ярмарке штата Колорадо.
Он сгенерировал 100 изображений с помощью нейросети Midjourney, отобрал 3 лучших, а после увеличил изображения с помощью другой нейросети Gigapixel AI.
Изображение, которое принесло художнику победу, действительно напоминает работы старых мастеров, типа Рембрандта и Караваджо. Возможно, он использовал их картины для генерации нового изображения, но получилось просто волшебно.
В сети есть множество клипов на песни известных исполнителей, которые сделаны из сгенерированных в Midjourney изображений. Вот один из таких примеров, где автор сделал клип на песню группы «Король и Шут».
Пейзажи, которые создала нейросеть, удивительно точно подходят под слова и атмосферу песни, а их качество просто завораживает.
Производство таких клипов можно монетизировать несколькими способами. Первый — это самому выкладывать видео в YouTube и зарабатывать на монетизации. В среднем, такие клипы набирают от 60 000 до 3 миллионов просмотров. Вот клип на песню «Биография» группы «Кровосток», который набрал 500 000 просмотров.
Конечно, для России монетизация отпадает, но остается ещё второй вариант — профессионально заняться созданием таких клипов. Возможно, в какой-то момент ваши работы заинтересуют исполнителей и клипмейкеров. В наше время всё возможно, главное — качественно подать идею. Тем более, что изображения из Midjourney можно оживлять в Stable Diffusion, о которой расскажем ниже.
А если еще и генерировать музыку («биты») по текстовому запросу через сервис Mubert, то можно вообще создавать уникальные клипы. Однако если надумаете зарабатывать на клипах известных исполнителей, то имейте в виду, что YouTube «предъявляет» за авторские права. Поэтому те, кто уже делают такие клипы, изменяют звуковую дорожку так, чтобы их не распознали алгоритмы видеохостинга. А эти алгоритмы очень строгие — они даже тем битмейкерам, которые делают музыку сами, могут «предъявить» за какой-нибудь мелкий звук: мол, сэмпл находится под защитой авторских прав. Музыкантам приходится из-за этого часто переделывать и перезаливать свои работы. Наверняка такая проблема ждёт и Mubert, просто пользователи сети его еще не протестировали должным образом.
Это программа на основе ИИ с открытым исходным кодом, которая была выпущена в публичный доступ 22 августа 2022 года. Результаты работы Stable diffusion похожи на DALL-E 2 и Midjourney, о которых мы рассказали выше, но отличается тем, что программа полностью бесплатная и работает без ограничений. Эта нейросеть делает такие же потрясающие и поражающие воображение пейзажи и персонажей, меняет стиль изображений и генерирует любые текстовые запросы, как и ее «коллеги».
Кстати предыдущие сервисы платные, но есть бесплатный пробный период, условия которого, как и ценовая политика, часто меняются — поэтому и не стали писать в подборке, но дали ссылки на официальные сайты.
Вот пример того, как ИИ сгенерировал из примитивного наброска реалистичный рисунок за два клика:
Это говорит о том, что Stable Diffusion можно использовать для создания логотипов, даже если вы совсем не умеете рисовать. Главное — примерно показать, что вам нужно, а дальше перебирать варианты и добавлять пожелания.
Также в Stable Diffusion можно генерировать анимации на основе видео и текста. Вот ремейк сцены с танцем из фильма Ла-Ла Ленд в стиле аниме с частотой 8 кадров в секунду.
Из-за того, что у программы открытый исходных код, возникли некоторые волнения о том, как её контролировать. В этом случае нейросеть можно использовать для генерации запрещенных изображений, таких как пропаганда, насилие и порнография.
В сети также начались волнения по поводу авторских прав. ИИ собирает все изображения из открытых источников — в нее попадают и картины современных художников, защищенные авторским правом. Художник RJ Palmer выразил сильное беспокойство о работе Stable Diffusion и других подобных нейросетей, ведь его картины могут быть использованы нейронной сетью для генерации изображений.
Именно по этой причине сервисы со стоковыми фото и NFT не допускают к продаже и блокируют изображения, сделанные с помощью нейросетей. Они обосновывают это тем, что хоть изображение и новое, но оно сделано из множества фрагментов чужих картин и фотографий, а значит, они нарушают авторские права. Так, например, сабреддит «Дюна» недавно запретил изображения, сгенерированные ИИ, и обозначил их, как «контент, сделанный малыми усилиями».
Скорее всего, это изменится в будущем. Автор Telegram-канала «Метаверсище и ИИще», высказал свое мнение по этому поводу. Его посыл был в том, что нейросети и искусство — это проблема, которая только появилась, поэтому людям нужно понять, как действовать. По сути, мозг художника — это тоже обученная нейронная сеть, в которой содержится информация о картинах других художников, собственном опыте и жизненной позиции. Художник перерабатывает всё увиденное ранее во что-то новое и так получаются новые произведения искусства. Сейчас таким, как RJ Palmer, тяжело смириться с тем, что ИИ требуется на обработку огромного количества информации и генерацию чего-то нового считанные секунды, вот они и чувствуют несправедливость.
Художник и мультипликатор Павел Мунтян выразил похожую позицию:
Он считает, что творения ИИ — это новое искусство, которое пока полноценно не принято обществом.
Если разбираться глубже, то становится ясно, что изображения, полученные из ИИ, являются собственностью того, кто его сгенерировал. Просто вместо кистей и красок — нейронная сеть.
Это программа на основе ИИ для создания логотипов, которую создала студия Артемия Лебедева. Сервис предлагает за 9 900 рублей создать 5 разных проектов, в которые входят 999 логотипов. В ней можно поиграться со стилем, цветом, шрифтом и расположением для того, чтобы найти наиболее отвечающий запросам вариант.
В теории звучит круто. Никаких тебе поисков дизайнера, студии, дополнительной траты времени на правки — все можно сделать здесь и сейчас.
Арт-директор Digital агентства «Атвинта» протестировал нейронку для реального заказа. Его задачей было сгенерировать логотип для веб-платформы Arama, связанной с ОСАГО. Вот какие результаты они получили:
После того как результат показали заказчику, он ответил «я думал будет хуже». Но у нас назрел справедливый вопрос: за 9 900 рублей может быть хуже?
Пользователи в комментариях к посту агентства «Атвинта» на vc.ru пришли к единогласному мнению: они решили, что лучше заплатить дизайнеру втрое меньше, и получить логотип, который хоть как-то отражает ценности бренда.
Ещё один онлайн-инструмент для создания логотипов на базе ИИ — Looka. Отличия от Николая Иронова существенные: полноценный сбор информации и предпочтений перед началом генерации, нет ограничений по созданию логотипов и, самое главное, адекватная цена.
Все логотипы также являются полностью уникальными, а из-за углубленной проработки инструмента, они получаются качественнее и интереснее. Есть возможность скачать готовый результат в векторном формате и доработать лого вручную.
Генераций, как мы уже сказали, можно делать хоть сколько, а платить нужно только за скачивание готового результата и стоит это $4.99 за базовый вариант и $7.99 за расширенный. Логотип сразу скачивается в трех вариантах — цветном, черно-белом и прозрачном. Таким образом, вы будете иметь готовые лого для печати на любых поверхностях.
Это инструмент на базе ИИ, для быстрого создания макетов сайта. Инструмент невероятно прост в использовании: нужно просто набросать от руки интерфейс на бумаге, а затем загрузить его в Uizard и получить готовый аккуратный макет. Это волшебство, которое может упростить работу всем, кто создает свои сайты. Просто посмотрите, как это работает:
Сам по себе инструмент бесплатный, для начала работы нужно всего лишь зарегистрироваться. Также доступна расширенная платная версия за $12 в месяц, в которую входят неограниченное количество проектов и доступ ко всем шаблонам. В бесплатной версии доступны 3 проекта и 10 бесплатных шаблонов.
С помощью этого сервиса можно превращать наброски в трёхмерные модели. В отличие от Kaedim, который уже оклеймили обманом, исходники Symmetric Sketch опубликованы в открытый доступ, что позволяет любому убедиться в том, что это действительно делает программа, а не индусы. Однако отметим, что это не нейросеть. В сервисе используется хитрая дифф-геометрия и оптимизация
Несмотря на вышеуказанный факт, с Symmetric Sketch дизайнерам гораздо проще изготовить нужный объект, создать графику или виртуально поместить будущую мебель в квартиру.
Это система мониторинга упоминаний брендов в социальных сетях. Инструмент похож на сервис Mention, с отличием в том, что сбор и анализ информации происходит в реальном времени, с использованием искусственного интеллекта.
Инструмент действительно будет полезен для маркетингового исследования, притом известно, что он отлично мониторит Telegram, но тестирование с другими платформами еще не до конца раскрыты.
Надеемся, что сервис будет развиваться и полноценно сможет мониторить все популярные соцсети, или даже поисковые системы. В этом случае можно будет отслеживать не только упоминания конкретного бренда, но и отдельные слова, ведь принцип работы один — поиск по ключевым словам.
Bloom является открытой языковой моделью, работающей на основе ИИ и поддерживающей 46 естественных языков и 13 языков программирования. Разработчики решили сменить фокус с английского и развивать другие языки, которые до этого вообще не поддерживались подобными большими языковыми моделями.
Механизм работы прост: нужно написать подсказку, по которой ИИ сгенерирует нужный текст, будь то рецепт или структурированный рассказ. Такой инструмент можно применять где угодно, в том числе и в маркетинге. Если раньше вам приходилось заказывать текст для креативов у носителей языка, то теперь вы можете самостоятельно сгенерировать его в Bloom. Самое приятное, что Bloom полностью бесплатный. Почему бы и не попробовать?
Это нейронная сеть, которая преобразует написанный текст в звуковой ряд. Вы можете выбирать мужской и женский голос, а также озвучивать бесплатно и платно — за токены. Стоимость PRO озвучки рассчитывается исходя из того, что 1 символ = 1 рублю. Данный сервис используют многие крупные YouTube-каналы и на телевидении. В сервисе есть более 20 языков и куча разных голосов.
Программы на основе нейросети, которые работают со звуком, могут быть очень полезны при озвучке креативов, например, для гемблинга. Можно подобрать отрывок из настоящих новостей, в котором говорят о том, что кто-то победил в лотерею, и наложить на него озвучку этой нейросетью. Получится отличный креатив, который вызовет доверие у аудитории. Для этого также подойдут такие программы, как:
Позже мы выпустим подробный обзор и сравнение всех этих и других программ для озвучки нейросетями.
Применять эти нейронные сети можно не только для креативов, но и для озвучки видео в TikTok или YouTube, а также других целей. Например, год назад скамер пытался обмануть две крипто-партнерки. Вся его ложь строилась на том, что он использовал программы с Deep Fake для подмены реального голоса, чтобы создать две разные личности. И какое-то время ему это удавалось. В один момент программа дала сбой и тогда его вычислили по настоящему голосу. О том, как партнерка разоблачала обманщика, можно прочитать здесь.
Pixelcut — приложение для смартфона, разработанное на базе нейронной сети для более эффективного и простого редактирования изображений. Приложение условно-бесплатное и доступно в App Store и Play Market.
В Pixelcut можно убирать фон, ненужные предметы и надписи, восстанавливать качество и накладывать всевозможные фоны, наклейки и тексты.
Приложение работает на базе ИИ и идеально подходит для того, чтобы полноценно редактировать видео. В нем можно улучшить FPS, сделать видео цветным, очистить видео от дефектов и перевести его в формат 4K. Нейронка способна сама вычислить, по какой траектории движется объект, чтобы достроить недостающие кадры и сделать видео плавным — настоящая магия!
Приложение бесплатное и его можно скачать здесь.
Также существует множество других популярных программ и сервисов, например:
Помимо перечисленных выше, есть множество других программ, о которых мы расскажем позднее в предстоящем обзоре.
Если вы задавались вопросом: «Ну и как мне могут пригодиться нейронные сети?», то очень надеемся, что мы смогли ответить на этот вопрос. Нейронные сети применяются во всевозможных областях, и они действительно делают жизнь проще и интереснее. Стоит только попробовать, и вы уже задумаетесь, как жили без них раньше.
Мы будем и дальше рассказывать о новых нейронках, и главное, как и где их применить. Будем сравнивать, какие работают хуже, а какие лучше. И будем постоянно подкидывать вам новые идеи для использования, которые облегчат вашу рабочую рутину.
Больше экспертных советов, фишек, лайфхаков, полезных знакомств - на Конференциях. Зарегистрироваться на ближайшее топовое мероприятие лучше прямо сейчас, пока действуют льготные цены на раннее бронирование, у нас в разделе Конференции!