Статья написана в корпоративном блоге — редакция Партнеркина не вносит изменения в текст. Вся орфография, пунктуация и содержание сохранены Подробнее про платные блоги и о том, как эффективнее работать с блогами 😎
14 марта 2023 0 2202

Как на самом деле работают клоаки? Чем отличается хорошая клоака от плохой и почему ты переплачиваешь за маркетинг

«У нас самая непробиваемая клоака», «Используем искусственный интеллект для анализа трафика», «Анализируем SSL-фингерпринты». Такие заявления — отличный способ привлечь новых доверчивых клиентов и задрать цену. Чтобы понять почему подобные заявления — не более, чем маркетинг, нужно разбираться в том, как вообще клоаки работают. Именно об этом я сегодня расскажу. 

Привет! На связи Антон Резник. Я продолжаю делиться контентом, полезным для всех, кто создает или думает создать свою партнерку. Почему-то такой информации нигде нет. Если тебе интересно — подписывайся на мой блог Как создать ПП и не разориться.

Как работает клоака
Клоака анализирует входящий трафик и по результатам своего чекинга подтягивает либо black-page для обычного человека, который перешел с рекламы, либо white-page для ботов и модераторов.

Как анализируется входящий трафик
Самый важный тезис — клоака должна анализировать только те данные, которые может получить до того как юзер увидел сайт. Очевидно потому что первично принятие решения о том какую страницу вообще показывать. Нам доступны:

1. Заголовки, содержащие в себе IP-адреса. Выглядят они примерно вот так:

  • CF-Connecting-IP;
  • X-Forwarded-For;
  • X-Real-IP;
  • Client-IP;
  • Remote-Addr.

Адреса в них могут быть разными. Например, человек использует Opera Turbo или его провайдер проксриует трафик. Потому анализировать нужно все адреса, которые поймали в этих заголовках. 

Тут сразу можно выловить первый триггер — нецелевое гео. Автоматический бан. Далее клоака должна сверять айпишники со своей базой черных списков. Именно в размере базы и в том какие инструменты используются для ее составления, и лежит ключевое отличие хорошей клоаки от плохой. Увы, подробно о составлении максимально полных черных списков рассказать не могу. Это секрет моей клоаки AlterCPA ONE, которую я не рекламирую, потому что такое чудо в рекламе не нуждается.

К примеру, Facebook* сам публикует базу адресов своих ботов. Есть еще вот такая известная всем база.

Также есть разные фишки по составлению черных списков. К примеру, если с одной подсети заходит много нецелевого трафика — можно заблокировать сразу всю подсеть.

2. Заголовок с user agent.

У живого человека сразу будет видно мобильное устройство или десктоп. А бот здесь же подпишется, что он бот. Если юзерагента нет — смело отправляем на вайт, у реального человека он есть всегда. 

3. Заголовок Accept Language.

Используется почему-то не во всех клоаках. В этом заголовке указывается, какие языки принимает браузер. К примеру, трафик идет на Россию, но в Accept Language только английский — отправляем на вайт. Отсутствия локального языка в Accept Language — один из основных триггеров.

Развеиваем самые распространенные маркетинговые уловки клоак
Некоторые кло заявляют, что собирают черные списки по finger print устройства, что само по себе крайне глупая затея. Выдавать ее за преимущество, как минимум, странно. 

Во-первых, чтобы получить фингерпринт, нужно сделать запрос скриптом еще до того, как человек попал на сайт. Тот же Google выдаст ошибку «Вредоносное ПО» и можно прощаться с рекламной кампанией. 

А во-вторых, отпечатки одного и того же модератора меняются.

Есть и более интересный способ — сбор отпечатков SSL-соединения. Это еще больший обман. Один и тот же модератор при связи с одним сервером будет иметь один отпечаток, а при связи со вторым — уже другой. Адреса серверов клоаки постоянно меняются, иначе они будут просто заблокированы рекламными сетями. Потому и способ ловли по фингерпринтам SSL-соединения не рабочий.

И мое любимое: машинное обучение, искусственный интеллект etc. В любой сфере применения этой технологии есть важное условие. Должна быть возможность из полученных данных составить рабочую корреляцию. На входе юзера мы не получаем ни размеры экрана, ни количество ядер процессора, никакой информации, которую можно проанализировать таким образом, чтобы собрать закономерности. По-хорошему для такой аналитики, необходимо получать данные о поведении, например, движение мыши, как минимум, что нереально. Соответственно и корреляцию, работающую с адекватным уровнем попадания, составить также нельзя. Работать это может только при сборе данных скриптами еще до попадания человека на сайт. Почему злоупотреблять скриптами нельзя написал выше.

Почему cloud-клоака лучше self-hosted
Эффективность клоаки на 80+% зависит от размера ее черных списков. Хорошая облачная клоака анализирует трафик ВСЕХ клиентов по всем гео, и адаптирует черные списки. 

Чем же отличается хорошая клоака от плохой? Дорогая от дешевой?
Все инструменты, которые реально работают, примитивны. Анализ IP, юзерагентов, языка. Хорошая клоака просто умеет грамотно с этим работать. И таких много. Дорогие клоаки обещают искусственный интеллект и прочие прелести, но платить за это нецелесообразно. Разве что вам нравится сопутствующий сервис и вы фанат бренда. 

Лучше ли моя AlterCPA ONE чем адекватные конкуренты? Нет. Может ли пробиваться? Да, как и все. Происходит такое крайне редко и все же гарантировать 0 пробоев будет только мошенник. Но она дешевле, а работает ровно так же. 

Вывод
Не ведитесь на маркетинговые приемы. Анализ трафика не нужно усложнять, он примитивен, хотя бы, потому что у клоаки не так много данных для чекинга. Выбирайте простой качественный и дешевый облачный вариант — это все, что нужно чтобы минимизировать пробивы, которые вероятны, как ни крути.

Кстати, как сделать свою ПП от А до Я можно почитать вот в этом посте. Надеюсь, материал был полезен. Не забудь подписаться на мой блог!

 
Как вам статья?

Топовая партнерка 1xSlots