nickspringЯндекс и UTF-8. Глюки продолжаются.

  30.01.2007, nickspring

Как-то обсуждал преимущества UTF-8 на searchengines.ru и мне указали на явный недостаток - в сниппетах Яндекс русскую букву "Р" (именно заглавную) заменяет знаком вопроса "?". Недавно такой же глюк мы получили на одном из своих сайтов. Сейчас можно однозначно сказать, что у нас была ошибка и у Яндекса она тоже имеется, причем той же природы . Дело в том, что просто в одном из регулярных выражений, обрабатывающих текст, не указано, что текст в кодировке Unicode. У нас это выглядело так (на языке PHP):

$text = preg_replace(’/\s+/’, ‘’, $text);

а надо:

$text = preg_replace(’/\s+/u’, ‘’, $text);

В первом случае происходит обработка строки с учетом того, что 1 байт = 1 символ (а это не так) , из-за чего "портится" русская "Р".

Уважаемые разработчики Яндекса, когда поправим у себя? ;-)

Добавить в  google.com bobrdobr.ru del.icio.us technorati.com linkstore.ru news2.ru rumarkz.ru memori.ru moemesto.ru

Комментарии (3) к статье "Яндекс и UTF-8. Глюки продолжаются."

  1. Scan пишет:

    Николай, 5 баллов!

  2. nickspring пишет:

  3. Lex San пишет:

    У меня та же ошибка, спасибо.

Оставьте комментарий

Уважаемые SEOш... спамеры! Ссылки в комментариях в теге «noindex» и с атрибутом «nofollow». Пишите, пожалуйста, по делу.

Присылать комментарии на