Тюбингенские корпусы русских текстов

Справка о возможностях поиска

В качестве поисковых выражений допускаются словоформы и регулярные выражения. Необходимо искать целые словоформы. Поисковое выражение должно содержать в себе полную словоформу. Для обозначения произвольной части слова возможно использование символов ".*" (точка и звездочка).
Согласно с выбранной опцией, заглавные и строчные буквы различаются или не различаются. Словоформы разделяются пробелом. Это относится также к знакам препинания, так как они рассматриваются как отдельные слова.
Точку в аббревиатурах (и т. д., М. С.) или в конце предложения при поиске надо задать знаком "# ", а вопросительный знак ("?") как "\?", потому что точка и вопросительный знак в регулярных выражениях являются метасимволами.
Если выбрана кодировка "КОИ8" или "Windows 1251", то ввод осуществляется либо русскими буквами по выбраной кодировке, либо латинскими буквами по нашей системе транслитерации. Допускается даже смесь русских и латинских букв.
Помимо целых словоформ можно использовать регулярные выражения языка PERL.
(См. краткое введение в регулярные выражения)
( Детальное описание регулярных выражений в языке PERL)

Примеры

нет дома будет найдено: нет дома
со знаками усечения слов:
дом.* будет найдено: (все словоформы, начинающие на "дом")
поиск знаков препинания (точка, вопросительный знак)
нет \? будет найдено: нет ?
нет # будет найдено: нет .
и t# д# будет найдено: и t. д.
с помощью регулярных выражений:
дом(а|у|е|о[вм]|ах|ами?)? будет найдено: дом, дома, дому, доме, домом, домов, домам, домами, домах.
(перед|за) домомбудет найдено: перед домом, за домом
ее( нет)? дома будет найдено: ее дома, ее нет дома


Обратно к: Корпусы русских текстов в Тюбингене
Michael Betsch
Last modified: Mon Jul 5 14:31:53 MET DST