Автор: Sergey Здравствуйте Сергей! На http://www.codeplex.com/Morphology в релизе опубликовал примеры экспорта данных. database-sources.zip - это архив с файлами ZlAttributes.csv, ZlSpecifiers.csv, ZlTransforms.csv и ZlStatements.ini. all-word-forms.zip - это полный список слов, который генерируется программой на основе базы данных морфологии. |
|
Спасибо, весма полезно!
особенно понравися текстовый файл из архива all-word-forms.zip
72 метра текста, это хороший повод проверить свои навыки по работе обработке текста... :-)
одно немного недопонял, есть сомнения насчет чистоты словарной базы
естественно в ручную я ее не просматривал, но заинтересовался, что это за слова в которы за 30 буков...
к примеру:
спецнефтеэнергомонтажавтоматика
спецнефтеэнергомонтажавтоматике
спецнефтеэнергомонтажавтоматике
спецнефтеэнергомонтажавтоматики
спецнефтеэнергомонтажавтоматико
спецнефтеэнергомонтажавтоматико
спецнефтеэнергомонтажавтоматику
средневолжсксельэлектросетьстро
средневолжсксельэлектросетьстро
средневолжсксельэлектросетьстро
средневолжсксельэлектросетьстро
средневолжсксельэлектросетьстро
средневолжсксельэлектросетьстро
ставропольскагропроммехмонтажам
ставропольскагропроммехмонтажам
ставропольскагропроммехмонтажах
ставропольскагропроммехмонтажей
ставропольскагропроммехмонтажем
ставропольскагропроммехмонтажов
ставропольскагропроммехмонтажом
старопохвистневоагропромтрансам
старопохвистневоагропромтрансам
старопохвистневоагропромтрансах
старопохвистневоагропромтрансов
старопохвистневоагропромтрансом
20421,875