Из этой статьи вы узнаете, как Google обрабатывает PDF-файлы, как оптимизировать их для SEO и как отслеживать просмотры PDF.
Google впервые начал индексировать PDF-файлы в 2001 году. Этот формат документов обычно используется в государственных, научных и деловых кругах.
PDF-файлы отлично себя ведут с точки зрения совместимости и согласованности. Они отображаются практически на любом устройстве и всегда выглядят примерно одинаково. Однако, если вы регулярно создаёте новый контент для интернета, лучше всё же использовать классические веб-страницы вместо PDF.
Ниже мы с вами рассмотрим:
PDF-файлы отображаются в результатах поиска Google с тегом «PDF».
PDF-файлы преобразуются и индексируются, как HTML. Для PDF, где есть изображения текста, Google использует технологию оптического распознавания символов (OCR) для преобразования изображения текста в текст. Картинки в PDF также отображаются в результатах поиска изображений.
Если контент из PDF продублирован на обычной веб-странице, то Google предпочтёт её. То есть в результатах поиска будет отображаться классическая страница, а не PDF.
Несмотря на то, что Google индексирует и ранжирует PDF-файлы, формат имеет несколько недостатков, по сравнению с веб-страницами:
Тем не менее, бывают ситуации, когда без PDF не обойтись. Это важный элемент контент-маркетинга. Поэтому давайте перейдём к той части, где вы узнаете, как оптимизировать PDF-файлы для поисковых систем.
Большинство элементов внутренней оптимизации сайтов, которые вы привыкли применять для HTML, имеют свои эквиваленты в PDF и используются так же. Поэтому давайте обсудим несколько способов оптимизации PDF-файлов с точки зрения SEO:
Миссия компании Google заключается в организации мировой информации. Даже если это не веб-страница, хороший контент – это хороший контент.
Существует много качественного контента в формате PDF-файлов: техническая документация, официальные отчёты и т.д. В ПДФ-формате скрыта лучшая часть информации Сети.
Так же как и в классических страницах, в PDF-файлах есть теги заголовков (title). Обратите внимание, что многие поисковые системы используют заголовок для описания документа в своих результатах поиска. Если у PDF нет заголовка, в поисковой выдаче будет отображаться имя файла.
Вот как можно редактировать заголовок PDF в Adobe Acrobat:
Как и в случае метаописаний для веб-страниц, это не является фактором ранжирования, но даёт вам возможность контролировать текст, который появляется в результатах поиска.
Имя PDF-файла будет частью URL. Это повлияет на URL, отображаемый в результатах поиска, и является небольшим фактором ранжирования.
Чтобы помочь поисковым системам понять содержание картинок, вы можете добавить дополнительный текст к изображениям в вашем PDF.
Точно так же, как и в классических веб-документах, вы можете указать, что определённый текст в PDF-файле является заголовком (H1-H6).
Внутренние и внешние ссылки влияют на ранжирование PDF-документов. Как и в случае с обычными страницами сайтов. Ссылки передают PageRank, а их анкорный текст добавляет контекст.
Включая ссылки на ваш PDF-файл и устанавливая ссылки из него на другие страницы интернета, вы помогаете PageRank проходить через ваш сайт. Некоторые ПДФ-файлы получают много обратных ссылок. Ларри Пейдж однажды сказал: «Оказывается, люди, получившие Нобелевскую премию, цитируются в 10,000 разных газет».
Вот пример документа с общим регламентом по защите данных (GDPR). На него стоит 119 тысяч обратных ссылок с 855 доменов. И при этом внутри – ни одной исходящей ссылки. Это упущенная возможность. Поставьте с него бэки на другие страницы сайта и гарантированно увидите рост позиций.
Другой пример из Google. На их PDF-руководство по SEO для начинающих стоит 3.5 тысячи ссылок с 772 доменов. И они прекрасно справляются с передачей веса на другие страницы.
Чтобы добавить ссылки в PDF:
Как уже упоминалось ранее, PDF-файлы сложнее отслеживать, по сравнению с обычными веб-документами. Из-за этого многие маркетинговые команды стремятся закрывать PDF-файлы или делать их доступными только после того, как пользователь заполняет форму на сайте. Делая это, они смещают акцент с отслеживания трафика на генерацию лидов.
Тем не менее, есть несколько вариантов для отслеживания просмотров ваших PDF-файлов, в том числе:
Вы можете отслеживать клики по PDF-ссылкам и отправлять их в свою систему аналитики. Это позволяет увидеть, сколько раз люди нажимали на PDF-файлы, чтобы загрузить или открыть их. Подробности читайте в официальной справке Гугла о дополнительных типах отслеживания.
Если вы встраиваете PDF в страницу сайта, используя JavaScript или iframe, можно просто использовать стандартную аналитику для самой страницы.
Это сложное решение. Вы можете отправлять PDF-клики через промежуточный скрипт отслеживания, который посылает информацию в аналитику до того, как перенаправить пользователя в PDF-документ. Пример реализации можно посмотреть тут.
Поскольку PDF-файлы хранятся на сервере, любые запросы доступа к ним будут записываться в файлы журнала событий.
Поскольку PDF-файлы редко отслеживаются в аналитических системах, зачастую информацию проще всего получить из сторонних сервисов, таких как Google Search Console или Ahrefs. В последнем, к слову, вы можете посмотреть, какие ПДФ ваших конкурентов получают больше всего органического трафика. Просто впишите их домены в Site Explorer, а затем перейдите к отчёту «Самые популярные страницы» и найдите URL-адреса, содержащие .pdf.
Надеюсь, теперь вы ещё больше убеждены, что новый контент лучше размещать на обычных веб-страницах, а не в PDF. Но что на счёт старых PDF-файлов? Стоит ли их переделать в классические страницы или оптимизировать под поисковые системы?
Как и в большинстве случаев, касающихся SEO, это зависит от различных факторов. Здесь нет однозначно правильного или неправильного выбора. Делайте так, как вам проще. Главное, чтобы был позитивный результат.
Источник информации: блог Ahrefs.
Сообщение Поисковая оптимизация PDF файлов [инструкция от Ahrefs] появились сначала на Блог SEO-аспиранта.