16 февраля 2021 2 621

Искусственный интеллект Яндекс.Директ: на что обращает внимание при модерации

Продолжаем исследовать причины отклонов и банов по 15 пункту в Яндекс.Директ. Как стало известно ИИ обучается в том числе и за счет выполнения заданий в toloka.yandex.ru. В бирже заданий от Яндекса можно найти задания по модерации статей для Яндекс Дзена, картинки и текста объявлений для директа, проверка работоспособности сайтов и многих других заданий неудобных для арбитражников.

Из многочисленных тестов можно предположить, что результатом такой модерации может быть только отклон объявления, полномочиями для бана аккаунта обладают только сотрудники Яндекса. 

В условиях новой реальности нам придется понимать, что для ИИ будет привликательно, нейтрально, негативно и относится к категории спамм. Ниже я представил список требований из заданий по модерации, по результатам которых и происходит обучение.

Требования к изображениям:

Привлекательно 

  1. Профессиональные фото природы, животных.
  2. Городские пейзажи.
  3. Фотопортреты, сюжетные фото, изображения людей с положительными эмоциями.
  4. Натюрморты.
  5. Изображения на возвышенные темы.

Нейтрально

  1. Бытовые картины: простые, бессюжетные нехудожественные уличные фото или фото в помещении, хроники, несущие лишь информационный посыл, любительские фото.
  2. Товары: чаще всего вырезанный объект на белом фоне.
  3. Информационные объекты: сканы страниц, карты, баннеры, логотипы. 
  4. Изображения, не несущие никакой эстетической нагрузки и эмоциональной окраски – ни положительной, ни отрицательной.

Непривлекательно

  1. Специфические тематики: кровь, фекалии, телесные повреждения, вещи за гранью обычной человеческой анатомии.
  2. Крупные планы гениталий.

"Если изображение содержит один из обозначенных плохих признаков, в задании необходимо выбрать данный признак и ответ Нет. Если изображение хорошее (ни один из признаков к нему не подходит) - нужно выбрать ответ Да."

Перед вами тренировочная инструкция, разбирающая каждый из плохих признаков изображения по отдельности.

Плохой признак №1: "Товары для взрослых"

  • На изображении содержатся секс-игрушки (вибраторы, наручники, атрибутика БДСМ и т.д.)

Если на изображении содержится смазка, официальное (медицинское) средство от потенции или контрацептивы, и при этом на изображении

  • НЕТ слов "секс/интим" или их синонимов.
  • НЕТ символов "марс/венера"
  • НЕТ эротичных/постельных сцен

То изображение считается хорошим.

Плохой признак №2: "Эротика/порно"

На изображении содержатся:

  • Обнаженка/постельные сцены
  • Акцент на грудь/попу/гениталии
  • Нарисованные персонажи (например, анимэ) с намеком на эротику/порно
  • Эротическое белье на моделях обоего пола (стринги, кружевное, просвечивающее, с разрезами)

Хорошие изображения:

  • Спортивное и непрозрачное бельё, купальники, мини платья

Плохой признак №3: "Алкоголь/курение/наркотики"

  • Рекламируется алкогольная продукция/ее употребление
  • Рекламируется курение/парение И связанная с ними атрибутика (табачные изделия, электронные сигареты, кальяны и т.д.)
  • Рекламируются наркотические вещества/пропаганда их употребления.

Если на изображении содержатся винные шкафы, реклама лицензий на алкоголь, бокалы или книги/фильмы об алкогольной продукции и при этом на изображении

  • НЕТ указания конкретного алкогольного бренда
  • НЕТ побуждений к употреблению алкогольной продукции

ИЛИ

  • На изображении явно указано, что продукция безакогольная,

То изображение считается хорошим.

Плохой признак №4: "Казино/азартные игры (на деньги)"

  • На изображении присутствуют логотипы казино (Vavada, Вулкан, Азино 777 и т.д.)
  • Изображены игорные столы, игровые автоматы, приложения с онлайн-казино/азартными играми на телефоне/планшете/компьютере и заставки с игровых автоматов
  • На изображении призыв к игре на деньги

Если на изображении содержатся настольные игры, бильярд, лото, фильмы или книги о казино и при этом на изображении

  • НЕТ побуждений к игре на деньги

То изображение считается хорошим.

Плохой признак №5: "Деньги, банковские карты, реклама заработка/займов"

  • Изображение купюр или банковских карт без призывов к игре на деньги
  • Реклама заработка/займов

Плохой признак №6: "Оружие"

  • Холодное оружие, на изображении ВИДНО режущую часть
  • Огнестрельное, пневматическое оружие БЕЗ указания на изображении его модели
  • Метательное оружие
  • Мины и гранаты
  • Ракетное/торпедное оружие
  • Электрошокеры

Если на изображении игрушечное оружие/сцена из компьютерной игры, где оружие НЕ является центром/главной темой изображения

ИЛИ

Если на изображении содержатся ножи и при этом на изображении

  • видно только их рукоятку
  • очевидно, что нож кухонный

То изображение считается хорошим.

Плохой признак №7: "Пугающее/трагическое/отвратительное или оскорбительное изображение"

  • Пугающие изображения: нечисть (БЕЗ контекста в виде фильма/книги/постановки), сцены насилия, расчлененка, искривленные от ужаса/СИЛЬНОЙ боли лица людей, призывы к убийству/смерти, угрозы
  • Трагические изображения: кадры с места аварий, связь с самоубийством/абортом, ритуальные атрибуты
  • Отвратительные изображения: гной, прыщи, воспаления, грязь, разложение, объедки, рвота
  • Оскорбительные изображения: содержащие мат, жаргон, рекламирующие расизм/сексизм/нацизм, оскорбляющие ветеранов/инвалидов/государственную символику.

Плохой признак №8: "Элементы пользовательского интерфейса"

  • Имитация стандартных элементов пользовательского интерфейса (стандартные кнопки, которые нельзя нажать; курсор, который нельзя подвигать и т.д.)

Плохой признак №9: "Реклама мгновенного/"чудесного" похудения, улучшения потенции/внешности/здоровья"

  • Рекламируются не официальные медицинские средства, обещающие мгновенное/"чудесное" исцеление/похудение/улучшение самочувствия или внешности: БАДы, народные средства
  • Показаны результаты до и/или после мгновенного/"чудесного" похудения/улучшения потенции/улучшения здоровья/внешности

Плохой признак №10: "Неясно, что изображено"

  • Нет возможности идентифицировать объект, изображенный и рекламирующийся на картинке

Требования к контенту:

В этой инструкции описано, как размечать контент рекламного и нелегального характера. Он делится на несколько типов:

  • Спам: контент с рекламой товара или услуги, которая подана агрессивно, не имеет самостоятельной ценности для читателя или может навредить.
  • Незаконное: контент, в котором автор предлагает незаконные товары или услуги, или распространяет незаконную информацию
  • ОК: контент, не содержащий агрессивной рекламы, хотя может упоминать бренды или названия товаров и услуг и ссылки на них.

СПАМ

Контент с рекламой товара или услуги, которая подана агрессивно, не имеет самостоятельной ценности для читателя или может навредить. Такой контент создается с единственной целью – увести читателя по ссылке на внешний сайт, чтобы что-то ему продать. Характерные особенности спама:

  • Рекламируются различные уникальные чудо-товары, которые якобы немедленно помогут читателю от неизлечимых болезней и других проблем: амулеты, чудодейственные травяные сборы, ортезы и ортопедические подушки, видеорегистраторы и т.д.;
  • Читателя провоцируют пройти по ссылке либо запугиванием (например, штрафами), либо обещанием огромных скидок, которые вот-вот перестанут действовать;
  • Товар или услуга навязывается. Делается это с помощью манипулятивного и очень настойчивого тона изложения («Если вы еще не купили этот товар, то просто обязаны пойти и посмотреть! Не дайте себя провести! Кликайте»), обилия ссылок и призывов к покупке, агрессивного оформления с множеством стрелок и дополнительным форматированием, и другими способами привлечь внимание к рекламному сообщению.
  • Рекламная вставка появляется в совершенно несвязанном с ней тексте , например: «Обезличенная ссылка на банковскую карту в статье про гороскоп»
  • Отсутствует название бренда рекламируемого товара, ссылка дается не на официальный сайт, а на один из множества сайтов-однодневок;
  • Не содержится никакой потенциально интересной читателю информации. Есть только описание товара или услуги и ссылки/контакты для связи;
  • Обещается немедленное денежное обогащение (выигрыш в лотерею, внезапное пособие от государства всем подряд, легкий заработок, финансовые пирамиды и т.д.) – всё это виды мошенничества, при котором у пользователя на каком-то этапе просто крадут деньги или персональные данные. Пример: Внутри статей — ссылка на мошеннический сайт

Незаконное

  • Статьи или видео с предложением или пропагандой секс-услуг, даже если они оформлены как публикации на другую тему;
  • Статьи или видео о наркотиках, в которых даются советы по покупке, производству или употреблению, подчеркивается положительный эффект, считывается подталкивание читателя к тому, чтобы попробовать, есть попытка вызвать его интерес;
  • Статьи или видео о том, как изготовить оружие, взрывчатое вещество или его аналог, а также как их хранить, продавать, покупать и т.д.;
  • Публикации с советами о том, как совершить незаконное действие — скрутить счетчик, обмануть сотрудника ГИБДД, получить квартиру обманным путем, прослушать чужой телефон, обмануть налоговую, совершить браконьерство;
  • Любые публикации про ИГИЛ без обязательного упоминания, что эта организация запрещена на территории Российской Федерации.

ВНИМАНИЕ! Стоит отличать вышеописанный контент от обычных статей, касающихся таких тем, как оружие или наркотики. Если в них нет предложений покупки либо подробного описания изготовления в домашних условиях – таким статьям нужно ставить «ок». Это могут быть, например:

  • Авторский обзор вида оружия (история возникновения, изготовления, использования, например, на войне)
  • Расследование о том, как, где и зачем употребляется медицинская марихуана
  • Статья о секс-туризме в странах, в которых проституция разрешена
  • Новости о задержаниях или раскрытиях тех или иных преступлений, связанных с алкоголем, табаком или наркотиками

ОК

Обычные публикации, целью которых не является обмануть читателя, манипулятивно заставить его купить какой-то товар или услугу либо распространить незаконную информацию. При этом в публикации могут упоминаться различные бренды, а также сами товары и услуги в контексте новостей либо обзоров, например:

  • Экономические или деловые новости компаний, торговых марок, брендов.
  • Авторские обзоры товаров, которые не вызывают подозрений о недобросовестности автора, а ссылки ведут на общеизвестные бренды или магазины

Примеры:

«Новые пазлы от Hatber»

«Как зарабатывать на страховании ипотеки. Ипотечное страхование»

«Новый SSD со сканером отпечатков пальцев»

К хорошим публикациям также относится «нативная реклама». Она представляет собой контент с рекламой товара или услуги, который при этом имеет самостоятельную ценность для читателя. В нем может быть призыв к покупке, промо-код, любые другие стимулирующие предложения, а также ссылка на магазин, но эта реклама органично встроена в повествование и не агрессивна. В ней нет обещаний чудодейственного эффекта, манипуляций на чувстве страха, вины или стыда, дерзких лозунгов вроде «Заказывайте только у нас» или «Покупайте прямо сейчас». Кроме того, статья сама по себе должна быть потенциально интересна для читателя, быть прежде всего информативной.

Таким контентом может быть:

  • Авторский обзор товара или услуги какого-то конкретного бренда. Он может быть интересен и полезен читателю сам по себе, потому что товар или услуга в нем описаны подробно, в тексте есть ценные наблюдения автора, хорошие фотографии или видео. Пример: «10 компонентов для умного дома дешевле 20 тысяч рублей. Изучаем решения HIPER»
  • Статьи или видео производителя или поставщика о своем продукте или услуге. От спама они отличаются тем, что в них нет агрессивной подачи, и остается польза для читателя. Она может выражаться в рассказе о том, как пользоваться продуктом, как с помощью продукта решить конкретную проблему, историях покупателей, которые уже попробовали продукт или услугу, перечислением преимуществ и особенностей товара. Пример: «Духовой инструмент, на котором сможет научиться играть каждый» 

Это только краткий список заданий по которым идет обучение ИИ Яндекс.Директ. Если вам будет интересно ознакомиться с другими требованиями ЯД к модерации, то вы можете посмотреть задания по модерации в toloka.yandex.ru.

Ставь лайк, подписывайся на блог и получай еще больше новостей из мира арбитража.

Как вам статья?

#яндексдирект #баны #модерация #искусственный интеллект
Ооо годно! Спасибо
20 февраля, 14:02 0
krott
Спасибо за инфу
24 февраля, 19:15 0
ПОХОЖИЕ СТАТЬИ