letovТеперь тошноту можно измерить

  08.12.2006, letov

Николай Яровой выпустил новый сервис анализа страниц.
Скрипт анализирует текст на странице сайта на предмет количества слов, их вхождений в разные блоки, морфологических модификаций (на основе эвристического извлечения корня). Позволяет проводить анализ текстовых факторов и делает вывод об уровне текстового спама в документе (тошноты).

Кроме того есть возможность заливать и анализировать текстовый файл с набором слов, например, для изучения уровня тошноты в анкор-текстах ссылок.

Узнать больше о том, что такое тошнота, можно на форуме se.ru.

Добавить в  google.com bobrdobr.ru del.icio.us technorati.com linkstore.ru news2.ru rumarkz.ru memori.ru moemesto.ru

Комментарии (12) к статье "Теперь тошноту можно измерить"

  1. nickspring пишет:

    Добавлю, что тошноту можно было и раньше измерить и ее меряли, просто вручную долго считать. Вообще, тема актуальная и у всех на слуху. Думаю, что многим форум searchengines.ru поможет получить ответы на вопросы.

  2. nic2006 пишет:

    Респект! Нужный сервис!

  3. Scan пишет:

    nickspring, каким образом морфоанализатор построен? что-то часто, на мой взгляд, он ошибается.

  4. nickspring пишет:

    Безсловарный способ Стеммера Портера, потому и ошибается иногда, не сказал бы, что часто.

  5. Scan пишет:

    Стеммер с большой буквы - это не опечатка?

  6. nickspring пишет:

    О черт, точно. Ну вообщем, прикрутить mystem от Сегаловича нахрапом не вышло (он вообще под Linux чего-то сразу не хочет ), а возиться времени нет, ближе к НГ может прикрутим.

  7. Scan пишет:

    Так то полезный сервис.

  8. nickspring пишет:

    Прикручен Mystem от

  9. AotherMind пишет:

    Да, хорошая штучка, нужная и полезная.

  10. Weber пишет:

    nickspring, а насколько актуальна используемая формула подсчета сейчас?

  11. nickspring пишет:

    Формула актуальна в некоторой степени, но не точна.

  12. multicat пишет:

    Сколько стоит актуальная версия? )

Оставьте комментарий

Уважаемые SEOш... спамеры! Ссылки в комментариях в теге «noindex» и с атрибутом «nofollow». Пишите, пожалуйста, по делу.

Присылать комментарии на