Как использовать yourtext.guru с R?

  1. YourText.guru
  2. Получи свой токен
  3. Установите мой пакет R
  4. Создать руководство
  5. Получите ваши баллы за URL
  6. Как получить основной текст
  7. Получите ваши оценки для многих URL
  8. Заключение

Этим летом у меня была возможность протестировать YourText.guru и Cocon.se, оба инструмента известны и используются для оптимизации вашего сайта (ов).
Чтобы помочь людям, которые занимаются R и SEO, я создал первый пакет R, который позволяет вам легко манипулировать их API.
Я начну с представления YourText.guru и пакета с открытым исходным кодом R, созданного специально для этого случая: https://github.com/voltek62/writingAssistantR

Если вы предпочитаете Python, Жюльен Деневиль создал эту версию: https://gitlab.com/databulle/python_ytg

YourText.guru

YourTextGuru - это сервис, который предоставляет Руководства, которые помогут вам написать, по сравнению с запросом, общепризнанную цель - сэкономить ваше время.

Эти руководства создаются с использованием двух алгоритмов:

  • Имитация обработки, выполненной поисковой системой
  • Поиск текстов, связанных с предметом и определение наиболее важных ключевых выражений.

Имитация обработки, выполненной поисковой системой   Поиск текстов, связанных с предметом и определение наиболее важных ключевых выражений

Получи свой токен

У вас должен быть доступ к API, т.е. 100 € / месяц на момент написания этой статьи.
Просто перейдите на эту страницу, чтобы узнать свой ключ API: https://yourtext.guru/profil/api
У вас должен быть доступ к API, т
Этот ключ должен быть скопирован в корневой каталог вашего проекта в текстовом файле: ytg_configuration.txt

токен = VOTRECLEAPI отладка = ЛОЖЬ

Установите мой пакет R

Вы должны иметь Rstudio и пройти обучение основам R. Я приглашаю вас написать эти строки в консоли R.

библиотека (devtools) install_github ("voltek62 / writingAssistantR")

Чтобы инициализировать пакет, вам просто нужно использовать следующий код, будьте осторожны, функция initAPI прочитает ваш токен в вашем текстовом файле «ytg_configuration.txt»
Функция getStatus просто проверяет правильность соединения.

библиотека (RCurl) библиотека (rjson) библиотека (XML) initAPI () статус <- getStatus ()

Создать руководство

Если вы хотите создать руководство, оно очень простое, вы должны указать свой запрос, язык (здесь: en_us, en_gb) и нужный режим руководства:
- Премиум руководство предназначено для предоставления списка всех важных и важных слов, связанных с запросом.
- Руководство Oneshot предназначено для предоставления шаблона для написания текста приблизительно из 300 слов.

Я поставил цикл, который ждет окончания процесса, это может занять несколько минут.

guide <- createGuide ("crossfit", "en_us", "premium") guide_id <- guide $ guide_id while (getGuide (guide_id) == "error") {print ("Ваше руководство в настоящее время создается.") Sys. sleep (40)} print («Ваш гид готов») guide.all <- getGuide (guide_id)

Получите ваши баллы за URL

С пакетом R это очень просто, вам просто нужно указать свой URL и идентификатор руководства, ранее созданные.

url <- "http://www.wodnews.com" баллы <- checkGuide (guide_id, url)

Вы получите две оценки:
- soseo: общий балл представленного текста с точки зрения оптимизации (100% соответствует оптимизированному тексту до максимума нормального диапазона).
- dseo: оценка риска SEO. Этот процент может в некоторых крайних случаях превышать 100%.

Как получить основной текст

Я проверил несколько трюков, чтобы получить непосредственно основной текст страницы. Лучший способ - использовать XPath со следующим запросом.

// текст () [нет (предок :: выберите)] [нет (предок :: сценарий)] [нет (предок :: стиль)] [нет (предок :: NoScript)] [нет (предок :: форма)] [длина строки (.)> 10]

Если вы хотите пойти дальше по этому вопросу, я предлагаю вам прочитать:
- https://moz.com/devblog/benchmarking-python-content-extraction-algorithms-dragnet-readability-goose-and-eatiht/
- https://boilerpipe-web.appspot.com/

# скачать html html <- getURL (url, followlocation = TRUE) # анализ html doc = htmlParse (html, asText = TRUE) plain.text <- xpathSApply (doc, "// text () [not (ancestor :: select) ] [not (ancestor :: script)] [not (ancestor :: style)] [not (ancestor :: noscript)] [not (ancestor :: form)] [string-length (.)> 10] ", xmlValue ) txt <- вставить (plain.text, collapse = "")

Получите ваши оценки для многих URL

Я даю вам метод с Rvest, чтобы получить первые 100 результатов в Google, но есть тысячи методов.

библиотека (rvest) библиотека (httr) библиотека (stringr) библиотека (dplyr) запрос <- URLencode ("crossfit france") страница <- paste ("https://www.google.fr/search?num=100&espv=2&btnG= Rechercher & q = ", query," & start = 0 ", sep =" ") веб-страница <- read_html (page) googleTitle <- html_nodes (webpage," h3 a ") googleTitleText <- html_text (googleTitle) hrefgoogleTitleLink <- html (- html) "href") googleTitleLink <- str_replace_all (hrefgoogleTitleLink, "/url\\?q=|&sa=(.*)", "")

Теперь будет интересно получить оценки для каждого URL.

библиотека (dplyr) DF <- data.frame (Title = googleTitleText, Link = googleTitleLink, Score = 0, опасность = 0, stringsAsFactors = FALSE)%>% фильтра (grepl ("http", Link)) для (я в 1 : nrow (DF)) {ссылка <- DF [i,] $ Оценка баллов <- checkGuide (guide_id, ссылка) if (scores! = "error") {DF [i,] $ Score <- оценка $ оценка DF [ i,] $ danger <- получает оценку $ danger} finally = Sys.sleep (60)}

Вы получите таблицу с оценкой для каждого URL.

Заключение

Здесь, я надеюсь, вам будет полезно проанализировать ваш контент и контент конкурентов.

Я думаю, что если вам нужно создавать контент, важно использовать помощника по написанию, например yourtext.guru, так как он предназначен для нужд SEO, писателей и маркетологов.

В конце августа я собираюсь написать следующую статью: Как использовать Cocon.se с R?

Fr/search?
HrefgoogleTitleLink, "/url\\?
Se с R?