Я ожидаю, что большинство всех, кто работает в SEO, знают, что PDF-файлы индексируются поисковыми системами. PDF-файлы также могут отображаться с авторским фрагментом в поисковой выдаче Google. Но то, что формат файла может быть проиндексирован, не всегда означает, что это идеальный подход. Сегодня я хотел бы изучить плюсы и минусы PDF-файлов с точки зрения SEO.
Преимущества использования PDF-файлов
Есть несколько плюсов в использовании PDF-файлов. Помимо простоты использования, они могут помочь с индексацией, поскольку эти документы содержат метаданные, ссылки, индексируемое содержимое и атрибуты авторства.
1. Легко создать
PDF-файлы могут быть очень полезны для маркетологов, особенно с небольшими командами или ограниченными ресурсами. Их легко создавать - просто сохраните документ из Word, Illustrator и т. Д. В формате PDF. Пресс-релизы, тематические исследования, листы данных о продукции и многое другое можно быстро преобразовать в формат, готовый к использованию в Интернете. Для тех, у кого нет знаний в области HTML-программирования, PDF-файлы для определенных типов документов могут быть быстрым способом публикации веб-контента.
2. Содержат метаданные
PDF-файлы также содержат метаданные, такие как мета-ключевые слова и описания. Вы можете найти и изменить метаинформацию в разделе «Свойства» в меню «Файл» в Adobe Acrobat. Хотя метаданные больше не оказывают большого влияния на SEO, мне нравится думать о мета описании как о вашей возможности создать только правильное описание, которое заставит поисковика выбрать ваш сайт в поисковой выдаче, и я бы лучше написал мое собственное описание, чем поисковик выбрал его для меня.
3. Содержать ссылки
Как и веб-страницы, PDF-файлы также могут содержать ссылки, и за этими ссылками могут следовать роботы поисковых систем. Эти ссылки также могут содержать якорный текст.
4. Индексируемый контент
Возможно, наиболее привлекательным преимуществом использования PDF-файлов является то, что контент в формате PDF обычно читается и индексируется поисковыми системами. Однако не все PDF-файлы имеют читабельное содержимое. Чтобы текст был читабельным, его следует создавать как текст, а не как изображение, что делает его идеальным для создания PDF-файла из исходной программы, такой как Word или Illustrator.
5. Авторство применяется
Также как HTML-страницы, авторство может быть идентифицировано и выведено Google для PDF-файлов , Однако, как и в случае HTML-страниц, авторство будет отображаться только для первого автора в списке, поэтому важно убедиться, что предпочитаемый автор указан первым. Кроме того, PDF должен быть идентифицированным «автором» сайта в Google+ для этого автора.
Минусы использования PDF-файлов
Использование PDF-файлов имеет ряд недостатков, связанных с навигацией, и отсутствие контроля над длиной документа, содержанием страницы, организацией документа, редактированием кода, структурированной разметкой и отслеживанием.
1. Отсутствие навигации
Одна из моих самых больших проблем, связанных с чрезмерным использованием PDF-файлов для содержимого веб-сайта, заключается в том, что в PDF-файлах часто отсутствует навигация по сайту. Это означает, что когда посетитель сайта попадает на сайт, у него нет простого способа попасть на другие страницы сайта. Таким образом, если PDF-файл имеет высокий рейтинг в обычном поиске, а поисковик находит ссылку и попадает в PDF-файл, как этот посетитель может легко получить доступ к другому контенту на вашем сайте?
2. Длина документа
Поскольку документ так легко сохранить в формате PDF, не принято разбивать PDF на несколько небольших документов. Например, в случае технической документации или отчета PDF может варьироваться от нескольких страниц до сотен страниц. В некоторых случаях это не совсем подходит для SEO, поскольку в более длинных документах больше текста и часто много тем. Это означает, что один документ PDF, который будет соответствовать одному URL, может содержать много контента, который обычно может быть разбит на несколько страниц веб-сайта в HTML.
3. Отсутствие организации страницы / контроль
Несомненно, одним из самых больших преимуществ использования системы управления контентом для веб-сайта является организация и контроль страниц. Однако PDF-файлы не всегда работают в рамках организационной структуры CMS как страницы, а скорее как загрузка. Таким образом, полагаться на PDF как на контент страницы не идеально просто с точки зрения организации страницы и контроля.
4. Отсутствие возможностей редактирования кода
Несомненно, одним из преимуществ HTML-страниц является гибкость, с которой авторы HTML могут редактировать код сайта. Например, изображения могут быть оптимизированы для поиска по тегам и другим параметрам в HTML, но изображения также не могут быть оптимизированы в PDF. Это также делает PDF-файлы менее чем идеальными для соответствия требованиям 508, поскольку вы не можете добавить тег «alt» к каждому изображению в PDF.
5. Не могу реализовать структурированную разметку
Структурная разметка и богатые фрагменты, которые они могут генерировать, были показаны в различных исследованиях, чтобы улучшить видимость SERP и рейтинг кликов в органическом поиске. Но PDF-файлы не работают так же, как HTML - авторы не могут применять структурированную разметку к содержимому из-за того, как работает тип файла PDF.
По моей оценке, это настоящий недостаток PDF-файлов. Например, что если ваш PDF содержит рецепты? Вы не сможете использовать структурированную разметку вокруг этих рецептов, поэтому исключите эти рецепты из представления рецептов Google при обычном поиске и запретите показывать на этих рецептах фрагменты с богатым набором рецептов.
6. Отсутствие механизмов отслеживания
Я считаю, что самым большим недостатком использования PDF-файлов является отсутствие механизмов отслеживания, которые я могу применить к PDF-документам. Google Analytics может выполнять отслеживание с помощью отслеживания событий onclick для загрузок PDF, но другое отслеживание в PDF не так просто. Кроме того, на вашем сайте могут быть другие механизмы отслеживания, например система автоматизации маркетинга. Код отслеживания для этих систем также нельзя будет добавить в PDF.
В отличие от HTML-страниц, PDF-файлы значительно затрудняют полное понимание того, как посетитель продвигается по вашему сайту, что далеко не идеально.
Заключение
В конце концов, PDF-файлы явно не лучший вариант для SEO. Это не означает, что они вредны для SEO, но они просто не передают контроль над SEO в руки веб-мастера как такового. Чтобы реализовать наибольшие преимущества SEO, где это применимо, я рекомендую перенести контент с PDF на страницы сайта HTML, предоставляя веб-мастерам больший контроль, гибкость и лучшую возможность для SEO, а также преимущества видимости и отслеживания.
Мнения, выраженные в этой статье, принадлежат автору гостя и не обязательно относятся к Search Engine Land. Штатные авторы перечислены Вот ,