- YourText.guru
- Получи свой токен
- Установите мой пакет R
- Создать руководство
- Получите ваши баллы за URL
- Как получить основной текст
- Получите ваши оценки для многих URL
- Заключение
Этим летом у меня была возможность протестировать YourText.guru и Cocon.se, оба инструмента известны и используются для оптимизации вашего сайта (ов).
Чтобы помочь людям, которые занимаются R и SEO, я создал первый пакет R, который позволяет вам легко манипулировать их API.
Я начну с представления YourText.guru и пакета с открытым исходным кодом R, созданного специально для этого случая: https://github.com/voltek62/writingAssistantR
Если вы предпочитаете Python, Жюльен Деневиль создал эту версию: https://gitlab.com/databulle/python_ytg
YourText.guru
YourTextGuru - это сервис, который предоставляет Руководства, которые помогут вам написать, по сравнению с запросом, общепризнанную цель - сэкономить ваше время.
Эти руководства создаются с использованием двух алгоритмов:
- Имитация обработки, выполненной поисковой системой
- Поиск текстов, связанных с предметом и определение наиболее важных ключевых выражений.
Получи свой токен
У вас должен быть доступ к API, т.е. 100 € / месяц на момент написания этой статьи.
Просто перейдите на эту страницу, чтобы узнать свой ключ API: https://yourtext.guru/profil/api
Этот ключ должен быть скопирован в корневой каталог вашего проекта в текстовом файле: ytg_configuration.txt
токен = VOTRECLEAPI отладка = ЛОЖЬ
Установите мой пакет R
Вы должны иметь Rstudio и пройти обучение основам R. Я приглашаю вас написать эти строки в консоли R.
библиотека (devtools) install_github ("voltek62 / writingAssistantR")
Чтобы инициализировать пакет, вам просто нужно использовать следующий код, будьте осторожны, функция initAPI прочитает ваш токен в вашем текстовом файле «ytg_configuration.txt»
Функция getStatus просто проверяет правильность соединения.
библиотека (RCurl) библиотека (rjson) библиотека (XML) initAPI () статус <- getStatus ()
Создать руководство
Если вы хотите создать руководство, оно очень простое, вы должны указать свой запрос, язык (здесь: en_us, en_gb) и нужный режим руководства:
- Премиум руководство предназначено для предоставления списка всех важных и важных слов, связанных с запросом.
- Руководство Oneshot предназначено для предоставления шаблона для написания текста приблизительно из 300 слов.
Я поставил цикл, который ждет окончания процесса, это может занять несколько минут.
guide <- createGuide ("crossfit", "en_us", "premium") guide_id <- guide $ guide_id while (getGuide (guide_id) == "error") {print ("Ваше руководство в настоящее время создается.") Sys. sleep (40)} print («Ваш гид готов») guide.all <- getGuide (guide_id)
Получите ваши баллы за URL
С пакетом R это очень просто, вам просто нужно указать свой URL и идентификатор руководства, ранее созданные.
url <- "http://www.wodnews.com" баллы <- checkGuide (guide_id, url)
Вы получите две оценки:
- soseo: общий балл представленного текста с точки зрения оптимизации (100% соответствует оптимизированному тексту до максимума нормального диапазона).
- dseo: оценка риска SEO. Этот процент может в некоторых крайних случаях превышать 100%.
Как получить основной текст
Я проверил несколько трюков, чтобы получить непосредственно основной текст страницы. Лучший способ - использовать XPath со следующим запросом.
// текст () [нет (предок :: выберите)] [нет (предок :: сценарий)] [нет (предок :: стиль)] [нет (предок :: NoScript)] [нет (предок :: форма)] [длина строки (.)> 10]
Если вы хотите пойти дальше по этому вопросу, я предлагаю вам прочитать:
- https://moz.com/devblog/benchmarking-python-content-extraction-algorithms-dragnet-readability-goose-and-eatiht/
- https://boilerpipe-web.appspot.com/
# скачать html html <- getURL (url, followlocation = TRUE) # анализ html doc = htmlParse (html, asText = TRUE) plain.text <- xpathSApply (doc, "// text () [not (ancestor :: select) ] [not (ancestor :: script)] [not (ancestor :: style)] [not (ancestor :: noscript)] [not (ancestor :: form)] [string-length (.)> 10] ", xmlValue ) txt <- вставить (plain.text, collapse = "")
Получите ваши оценки для многих URL
Я даю вам метод с Rvest, чтобы получить первые 100 результатов в Google, но есть тысячи методов.
библиотека (rvest) библиотека (httr) библиотека (stringr) библиотека (dplyr) запрос <- URLencode ("crossfit france") страница <- paste ("https://www.google.fr/search?num=100&espv=2&btnG= Rechercher & q = ", query," & start = 0 ", sep =" ") веб-страница <- read_html (page) googleTitle <- html_nodes (webpage," h3 a ") googleTitleText <- html_text (googleTitle) hrefgoogleTitleLink <- html (- html) "href") googleTitleLink <- str_replace_all (hrefgoogleTitleLink, "/url\\?q=|&sa=(.*)", "")
Теперь будет интересно получить оценки для каждого URL.
библиотека (dplyr) DF <- data.frame (Title = googleTitleText, Link = googleTitleLink, Score = 0, опасность = 0, stringsAsFactors = FALSE)%>% фильтра (grepl ("http", Link)) для (я в 1 : nrow (DF)) {ссылка <- DF [i,] $ Оценка баллов <- checkGuide (guide_id, ссылка) if (scores! = "error") {DF [i,] $ Score <- оценка $ оценка DF [ i,] $ danger <- получает оценку $ danger} finally = Sys.sleep (60)}
Вы получите таблицу с оценкой для каждого URL.
Заключение
Здесь, я надеюсь, вам будет полезно проанализировать ваш контент и контент конкурентов.
Я думаю, что если вам нужно создавать контент, важно использовать помощника по написанию, например yourtext.guru, так как он предназначен для нужд SEO, писателей и маркетологов.
В конце августа я собираюсь написать следующую статью: Как использовать Cocon.se с R?
Fr/search?HrefgoogleTitleLink, "/url\\?
Se с R?