На пятой онлайн-конференции «SEO без воды», которая прошла на одноимённом YouTube-канале, выступил Владислав Попернюк с докладом о нейросетях.
Он рассказал о том, как устроены нейросети, а также о:
Спикер с 2008 года в SEO, а последние несколько лет, в сферу его интересов входят:
Самое интересное из доклада Владислава собрано в этой статье. Советуем дочитать её до конца, так как в заключении будет интересный подарок от докладчика.
Картинка ниже демонстрирует то, что на сленге людей, кто в теме, называется «нейрон». Это математическая модель, из которой собираются нейронные сети.
Простыми словами описать её можно следующим образом:
Весом в нейронных сетях называют силу связи между нейронами. Например, если вес соединения узлов 1 и 3 больше чем узлов 2 и 3, то это означает, что нейрон 1 оказывает на нейрон 3 большее влияние. Нулевой вес означает, что изменение входа не повлияет на выход. Отрицательный вес показывает, что увеличение входа уменьшит выход.
Все нейроны связываются в слои, которые друг за другом выстраиваются в нейронные сети. На скриншоте ниже пример трехслойной нейронной сети.
Все этапы данного процесса схематично изображены на картинке ниже.
1. На старте обучения нейронная сеть чиста как мозг младенца — в ней нет абсолютно никакой информации. Все веса распространяются полностью рандомно;
2. Для начала обучения сети производится прогон данных. Для этого подаются данные на вход и забираются на выходе;
3. Полученные на втором этапе данные сравниваются с неким эталонным значением;
4. На этом этапе происходит корректировка весов, посредством функции back propagation. Суть корректировки состоит в том, чтобы изменением весов, и последующими прогонами, максимально приблизить значение на выходе к эталону.
Подытоживая всё вышесказанное, попробуем резюмировать максимально простым и понятным языком:
Владислав описал такой порядок обработки текстов нейронной сетью:
На картинке ниже представлен пример оцифровки простого предложения.
Следующий скриншот демонстрирует оцифровку слова «окно» в стомерную матрицу.
Особенностью вектора является то, что его можно складывать вычитать и находить косинусную близость. В качестве примера, на скриншоте ниже представлена модель, обученная по сниппетам из Яндекса по фразе «пластиковые окна Москва цена». На картинке продемонстрированы униграммы, которые данная нейронная сеть считает релевантными вышеуказанной фразе.
Всё вышеизложенное относится к нейросетям первого поколения. По сути, их функционал достаточно ограничен и умеют делать они следующее:
Ниже перечислены важные для SEO задачи, с которыми нейронные сети первого поколения не справляются:
Как легко можно догадаться, архитектура трансформера выглядит ещё более сложной, чем нейросети первого поколения. Она представлена на картинке ниже. Самое основное, что необходимо знать о ней — это то, что она состоит из двух частей:
Обе части представляет собой трансформер T5 от Google — модель для машинного перевода.
Трансформеры имеют две ключевые особенности:
Тот, кто дочитал статью до этого места, вероятно, сделал такой вывод: «Ничего не понятно, но жутко интересно». Для того, чтобы во всём разобраться и применять нейросети в работе с сайтами, Папернюк рекомендует такой алгоритм действий:
1. Изучить базовые курсы:
Стоит рассчитывать на то, что данное обучение займёт времени от 3 месяцев до полугода;
2. Научиться парсить базы данные с XPath RegExp;
3. Освоить Google Colab — это наиболее лёгкая среда для машинного обучения. Подписка на нее платная: от $10 до $100 в месяц. Также есть сложность в том, что резидентам РФ придётся там регистрироваться под VPN или пользоваться антидетект-браузерами.
Помимо этого, Владислав предложил использовать созданный им ToDo List для того, чтобы освоиться в теме нейросетей:
Кроме этого, Попернюк дал ряд ссылок на полезные материалы по теме нейросетей:
В качестве подарка слушателям своего доклада, Владислав презентовал скрипт поиска униграмм. По этой ссылке можно перейти к скрипту, вбить Яндекс XML и ключевое слово. Например, «купить велосипед в Москве». Скрипт обращается к XML-выдаче Яндекс, выгружает оттуда все сниппеты, прогоняет их через свой алгоритм и выдаёт униграммы, проранжированные по косинусной близости к ключевой фразе.
От себя добавим, что самое легкое в нейронных сетях — это произношение данного словосочетания. В остальном нужно разбираться. Но если поисковики выстраивают работу на основе нейронных сетей, то, очевидно, что заниматься SEO, не имея представления о том, как они работают, как минимум недальновидно.
Подписывайтесь на наш Telegram-канал про классический манимейкинг, в котором мы пишем про SEO-оптимизацию сайтов и заработок на этом, а также про соцсети, YouTube и другие способы манимейкинга.
Я бы не усложнял, хочешь пользоваться — пользуйся, просто настрой работу по API. Изучать особенности функционирования и поднимать свои сетки это видеокарт и времени жизни не напасёшься.
Ну и ты делаешь это одновременно с ещё сотней, например, китайцев, которые явно имеют лучше образование и структуру головного мозга..
Попробовал скрипт, потому что нужная прям вещь, почему то не работает. Очень жаль. было бы круто иметь какой то функционал попроще, типа Арсенкина.