Неожиданная морфология в Яндексе

Я как-то привык к тому, что у Яндекса лемматизация вполне устроена в духе общепринятой морфологии, то есть «видовые пары» не объединяются в одну лексему. Однако же это не всегда так: покупать явно объединено в одну лексему с купить. Ложиться/лечь тоже в кучу. Можно еще пары поискать.

Забавно, что купить/покупать объединены только в русском языке, а в украинском — нет (ср.). Получается лишний способ узнать, считает ли Яндекс документ украинским. Было бы заманчиво смотреть из расширенного — &lang=uk, но выдача почему-то другая: ср. без указания языка и с ограничением по украинскому.

Баян, наверное — про «видовые пары». Или это недавно так стало?

Комментариев нет. Добавить »

[×]
Показать/Скрыть xHTML-теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>


Рейтинг блогов
8)