Необходимо сконвертировать slovesa.ru в словарь формата ABBYY Lingvo
вот такую к примеру страницу
slovesa.ru/assearch?q=%D8... необходимо привести к такому виду:
ШТАНИШКИ
[m][/m] [b]Ассоциации со словом «ШТАНИШКИ»[/b] [m][/m][b]«ШТАНИШКИ» связано с:[/b] [m][/m]ПОЕЗДКА КЛИНЫШЕК ЛОДЫЖКА ГИПОТЕЗА [m][/m] [b]ШТАНИШКИ бывает:[/b] [m][/m] КОРОТКИЙ ПОЛОСАТЫЙ ТЕМНО-СЕРЫЙ НАРЯДНЫЙ ЗИМНИЙ КОРОТЕНЬКИЙ СЕРЕНЬКИЙ УЗКИЙ БАРХАТНЫЙ НОВЫЙ ЗЛОСЧАСТНЫЙ КРОШЕЧНЫЙ ОЧЕРЕДНОЙ КАЗЕННЫЙ ТЕСНЫЙ ГУМАННЫЙ РОЗОВЫЙ ТЕМНО-СИНИЙ ВЯЗАНЫЙ [m][/m] [b]ШТАНИШКИ может(но):[/b] [m][/m]СНЯТЬ ПИСАТЬ НАДЕТЬ ИСЧЕЗНУТЬ [m][/m] [b]Раскраска [/b][m][/m] Розовый Темно-серый Темно-синий [m][/m] [b]Масштабность»[/b][m][/m] Крошечный
ту же операцию необходимо произвести с сайтом
wordassociations.ru (лучше даже начать с него, так как он полнее)
В двух словах, в dsl заглавное словарное слово начинается с новой строки, тело карточки с новой строки и табуляции, [m][/m] – перевод строки, а [b][/b] – полужир. То есть значимую информацию с КАЖДОЙ из страниц сайта нужно вынуть и слить в этих тегах в ОДИН текстовый файл.
желательно также чтобы каждое из словарных слов (ПОЕЗДКА КЛИНЫШЕК ЛОДЫЖКА ГИПОТЕЗА итд) было заключено в тег [ref][/ref]
подробней о dsl (языке словарей Lingvo) здесь:
lingvo.helpmax.net/ru/%D0... также перед преобразованием в формат dsl из словарных статей необходимо вычистить символы [ , ], #, @, <, >, \, чтобы они не мешали словарным тэгам.
вместо них можно использовать: (,), {,}
спасибо.