25 декабря 2020 5 2747

Нейросеть уже может генерировать контент на русском языке: тестируем GPT-3 от Сбербанка

Искусственный интеллект GPT-3 продолжает свое развитие во всем мире. В декабре Сбербанк выпустил русскоязычную версию с простым интерфейсом, которая позволяет генерировать контент на русском уже сегодня.

Неужели пора отказываться от копирайтеров? Насколько уникален и пригоден такой контент для сайта, и есть ли будущее у технологии GPT-3 в России? Тестируем программу и разбираемся вместе с экспертами.

Тестирование русской модели GPT-3 Large
GPT-3 — это нейронная сеть 3 поколения, на основе искусственного интеллекта, которая умеет писать музыку, делать дизайн, программировать, а также генерировать уникальные тексты.

На платформе Sbercloud представлена русскоязычная модель GPT-3 Large. Она включает в себя 760 000 000 параметров и может:

  • Генерировать текст на русском и английском.
  • Продолжать программный код.
  • Отвечать на вопросы.

Работать с программой нужно методом «затравочного программирования». Необходимо ввести запрос, а GPT-3 подстраивается под него. Разработчики сразу оговорились, что результат не может быть предугадан заранее, иногда он бывает неуместным — за это программисты никакой ответственности не несут.

Изображение выглядит как текст

Автоматически созданное описание

Я на данный момент работаю над заказом по seo-текстам для сайта по наркологии в Санкт-Петербурге, поэтому решил посмотреть, кто лучше: я или GPT-3?

Вбиваю ключ «Лечение наркомании в Санкт-Петербурге». Первые 5 попыток дают нелепые и смешные результаты:

Изображение выглядит как текст

Автоматически созданное описание

Изображение выглядит как текст

Автоматически созданное описание

Я решил уточнить задачу, что именно мне требуется. В окно «затравки» я вбил «Лечение наркомании в Санкт-Петербурге подробный текст». Результат был удачным:

Я получил контент на 1 255 символов с пробелами. Очень неплохого качества, со знанием дела и тематики.Изображение выглядит как текст

Автоматически созданное описание

Text.ru выдал 100% уникальность, ключевые показатели составили 33% заспамленности и 17% воды. Это соответствует требованиям моего заказчика. Хотя водянистость у меня обычно в зеленой зоне, не более 15%, но это мелочи. Можно подставить ключевые слова, и заказ готов.

Изображение выглядит как текст

Автоматически созданное описание

Я попробовал сделать еще один текст. Мне заказывают их 4 в неделю. Теперь GPT-3 меня сразу понял и выдал результат с первой попытки. Версия стала лучше, на 1312 символов с пробелами и походила на классический контент статейника по наркологии.Изображение выглядит как текст

Автоматически созданное описание

Показатель заспамленности поднялся до 42%, до моего стандартного уровня. Но это произошло из-за того, что GPT-3 сам включил в текст большое количество нужных ключей. Уникальность 100%. Для медицинской тематики это очень высокий показатель.

Изображение выглядит как текст

Автоматически созданное описание

Впечатление положительное. Конечно, программа понимает пользователя не сразу, выдает иногда бессмыслицу, но использовать ее как экстренного бесплатного копирайтера реально.

В России это единственная версия GPT-3. Я решил посмотреть, какие программы существуют в бурже. Я хорошо владею английским, поэтому иногда беру в работу контент на иностранном языке. Многие вебмастера также переходят на работу с буржем, поэтому наше исследование может быть им полезным, и даже помочь сэкономить денег.

Какая ситуация в бурже?
Когда летом я готовил первый материал об искусственном интеллекте, я зарегистрировался в листе ожидания OpenAI, разработчика GPT-3. Прошло больше четырех месяцев, а ответ на почту так и не пришел. При этом на самом портале набор продолжается до сих пор, только расширился список вопросов к кандидатам на демо доступ. Приоритет отдается академическим исследователям, к которым я, видимо, не отношусь.

Изображение выглядит как текст

Автоматически созданное описание

На данный момент за рубежом существует большое количество уже готовых решений на ИИ. Этому вопросу посвящен портал https://gpt3examples.com. Тут есть база программ и подборка твитов разработчиков. Правда, последние публикации были лишь в конце октября 2020 года. Потом у вебмастера либо не стало времени, либо пропал интерес. Но база все равно очень обширная. С ней удобно работать, можно даже скачать в формате CSV или распечатать.

Изображение выглядит как текст

Автоматически созданное описание

Первая программа, к которой я обратился, была сервисом почтовых рассылок Magic Email. На видео сообщалось, что можно по ключевым тезисам сгенерировать полноценное письмо, и это в 5 раз ускорит написание креативов для рассылок.

Изображение выглядит как текст

Автоматически созданное описание

К сожалению, после регистрации я увидел уже знакомую надпись о листе ожидания. Новых пользователей приглашают редко, разработчики предложили мне запастись терпением.

Следующей программой для тестирования стала https://app.snazzy.ai. Она предлагает большой вариант генерации креативов. От банального контекста или объявления в Facebook, Google Ads до полноценного позиционирования бренда. В начале работы программа предложила мне ввести название и ключевые особенности моего бизнеса, чтобы GPT-3 лучше понимал поставленные задачи.

Я решил протестировать самую популярную задачу — генерацию контента. Тему выбрал строительство загородных домов. Она близка мне по работе с заказчиками. Требовалось ввести следующую информацию:

  • Название темы
  • Краткое описание

Я указал 3 ключевых преимущества, и в результате получил полноценную статью о модульных домах с историей и даже небольшим количеством статистики.

Изображение выглядит как текст

Автоматически созданное описание

Deepfake для креативов — тренд 2021?

Результат оказался приличный, но бесплатная версия программы длится всего неделю. Далее за каждый месяц придется платить $49. Не очень дешево по нашим меркам.

Следующее решение называлось https://www.copy.ai. Помимо создания креативов, данная программа предлагала даже идеи «мозгового штурма», то есть новые продукты, концепции брендинга и даже поиска способов роста клиентской базы.

Изображение выглядит как текст

Автоматически созданное описание

В этот раз я затронул тематику финансов. В качестве идеи был выбран инвестиционный фонд малой капитализации. Ниша инвестиций популярна сейчас за рубежом. В результате мне были предложены 10 идей для стартапа с контентом разной степени проработки содержания:

Изображение выглядит как текст

Автоматически созданное описание

7 идей описаний моего продукта, также разной степени детализации:

Изображение выглядит как текст

Автоматически созданное описание

Результаты достойные, но следует учесть, что в исходных данных я указывал подробное описание объемом 649 знаков с пробелами, что помогло GPT-3 лучше меня понять.

Изображение выглядит как текст

Автоматически созданное описание

Увы, бесплатная версия доступна недолго, всего три дня. Далее стоимость составляет $35 в месяц.

А есть ли что-то бесплатное полностью? На журналистском портале deadline.media я увидел пресс-релиз о запуске полноценной бесплатной базы данных big data, предназначенной для работы именно с ИИ.

Изображение выглядит как текст

Автоматически созданное описание

На искомом портале https://tethys.xyz все действительно в свободном доступе. Но вот разобраться может тот, у кого есть навыки работы на Python или хотя бы опыт работы с Google Colab, GitHub.

Изображение выглядит как текст

Автоматически созданное описание

А как быть простым пользователям? Пользоваться только платными программами в бурже, а для генерации русскоязычного контента тестовым решением монополиста Сбербанка?

Как Сбербанк разрабатывал GPT-3 
Вернемся немного в прошлое. 22 октября 2020 года Сбербанк выложил в открытый доступ первую русскоязычную модель GPT-3, о чем сразу сообщили многие порталы, включая Т-Ж. Однако, пользоваться ей могли только пользователи с минимальными навыками, о чем говорил представитель разработчика.

Татьяна Шаврина 
Лидер команды AGI NLP Сбербанка

Работа с уже обученными моделями проста. Требуется уметь скачивать и запускать готовое решение и минимальный набор навыков уровня Junior Data Scientist:

  • Язык программирования Python. 
  • Понимание смысла одной метрики качества (перплексии). 

Для реализации собственной задумки на основе GPT-3 нужна уже идея и навыки прототипирования.

Пользователи активно ждали более популярной версии, задавали вопросы специалисту по машинному обучению Сбербанка Сергею Маркову.

Изображение выглядит как текст

Автоматически созданное описание

Релиз действительно состоялся, правда, с большой паузой. 4 декабря Сбербанк презентовал web-интерфейс для тестирования, а 15 декабря объявил о коммерческом запуске ML Space — облачной платформы для решений на основе GPT-3. Именно его мы сегодня и тестировали.

ML Space позиционируется как единственная система, позволяющая обучать ИИ более чем на 1 000 графических процессорах (GPU). Планы Сбербанка большие:

  • Сделать цены на программу самыми низкими — 3 рубля за GPU-минуту обучения и препроцессинга, 12 копеек за CPU-минуту, 0,054 копейки за инференс модели.
  • Выдавать предпринимателям гранты до 1 000 000 рублей на внедрение и обучение ML Space.

Результаты тестовой версии меня удовлетворили. Будет ли доступна пользователям бесплатная версия, или за нее все-таки придется платить.  Я решил узнать, что думают об этом специалисты отрасли.

Мнение эксперта
Финансовый директор компании Work Solutions Максим Мул уверен, что модель Сбербанка и вовсе не GPT-3.

Максим Мул
Финансовый директор Work Solutions

Стоит понимать, что модель от Сбера похожа на GPT-3, но не является ей. Сами авторы признают, что она в 230 раз меньше самой большой версии GPT-3, у которой 175 млрд весов, а значит, повторить результаты бенчмарков реальной GPT-3 она не сможет.

Сбер опирался на описание архитектуры GPT-3, которое, как показывает практика, может отличаться от реальной реализации. Сказать точно можно, только ознакомившись с тренировочными параметрами, и если раньше веса публиковали с задержкой, то в свете недавней сделки OpenAI и Microsoft шансы на это тают.

Многие пользователи в сети придерживаются такого же мнения, иногда не стесняясь в выражениях. Так настоящий ли это GPT-3 в России? Если нет, почему разработчики не используют оригинал?

Почему в России есть проблемы с GPT-3?
На данный момент частные разработчики в России практически не используют GPT-3. При этом за рубежом таких программ много. В чем причина?

Максим Мул
Финансовый директор Work Solutions

Российские разработчики могут запросить доступ к модели GPT-3 через высокоуровневое API. Реального доступа к модели нет ни у кого кроме Майкрософт, с которой OpenAI недавно заключила сделку и дала эксклюзивные права на использование.

Обучение GPT-3 обошлось OpenAI не менее $10 000 000. Таким образом, воспроизвести работу OpenAI могут только крупные компании c сильными ML-специалистами и мощными вычислительными ресурсами.

OpenAI обладает очень сильными маркетологами. GPT-3 — потрясающая технология, но у Google и Facebook есть открытые языковые модели не хуже. Просто они менее раскручены.

Доступ нашим специалистам получить сложно, но возможно. В сети прилагаются подробные инструкции, как сделать лендинг мнимого стартапа и уговорить разработчика GPT-3 дать доступ за 10 минут. Русская смекалка!

Изображение выглядит как текст

Автоматически созданное описание

Вывод
Русская версия GPT-3 существует только в исполнении Сбербанка. Правда, среди экспертов и вебмастеров есть мнение, что это лишь попытка создать свой ИИ по образу оригинала.

Основные причины для отсутствия русских приложений на GPT-3:

  • Трудность получения реального доступа.
  • Высокие затраты на разработку и обучение.

Тем не менее, решение Сбербанка практично, позволяет генерировать контент даже в тестовом доступе. Очевидно одно — технология GPT-3 развивается большими темпами, и появление полноценного программного обеспечения на русском языке лишь вопрос времени.

Будьте в курсе всех новостей и кейсов в 2021 году — подписывайтесь на наши Телеграм-каналы: основной каналe-commerce и классический манимейкинг.  

Как вам статья?

#gpt-3 #нейросеть
Получить актуальную подборку кейсов

Прямо сейчас бесплатно отправим подборку обучающих кейсов с прибылью от 14 730 до 536 900 ₽.

3TAJIОH Ответить
Этот комментарий написал ИИ от Сбербанка. Рейтинг по выбору категорий заявок «Разное» с 8-го по 11-е место в соответствующей группе.

Добрый день!

Я понимаю, что Вам не удобно пользоваться услугами Сбербанка и пользоваться дополнительной услугой «Сбербанк Онлайн для пенсионеров».

Я не получала Вашего смс от 16.10.2013г. для уточнения информации по карте (номер карты 86242-2108-625185) и о сумме задолженности.

Вы можете обратиться в СМС-Банке — написать на эл.адрес domashniy@sberbank.ru с данным вопросом и мы свяжемся с Вами для уточнения информации, при этом на основании предоставленных Вами данных мы сможем разобраться в ситуации.

С уважением, Валерий Курин.

В прошлом году получила карту Nordea Ecocel. Выплат не было. Как сейчас можно снять деньги и закрыть карту без комиссии? Спасибо

Добрый день, Анна!

Вы можете закрыть карту при условии, что Вы подадите заявку на её закрытие и предоставите необходимый пакет документов. Рекомендуем Вам обратиться в филиал Сбербанка по месту регистрации. Ознакомиться с услугами и тарифами по договору не представляется возможным, в связи с этим Вам необходимо проконсультироваться

25 декабря 2020, 14:35 0
Treasure
10 лимонов на обучение... А выхлоп с ИИ какой?)
28 декабря 2020, 13:00 0
Даша Ответить
Про арбитраж трафика что-то не очень получился текст. ИИ еще учиться и учиться)
28 декабря 2020, 16:24 0
На более бытовые и привычные темы самое то, мне кажется))
29 декабря 2020, 22:30 0
Я попробовал по ссылке что-нибудь написать, и даже примеры от разработчиков, но ИИ несет какую-то ахинею...
31 декабря 2020, 18:57 0