АВТОМАТИЗИРОВАННАЯ СИСТЕМА МОРФЕМНО-СЛОВООБРАЗОВАТЕЛЬНОГО АНАЛИЗА СЛОВ УКРАИНСКОГО ЯЗЫКА (АСМСА)
Назначение разработки:
АСМСА представляет большой лексический материал (170 тыс. слов), что позволяет говорить о полноте лингвистического описания морфемной и словообразовательной систем украинского языка.
Разработана методика и методология конструирования АСМСА, а также формализация описания морфов, морфных и словообразовательных структур может быть использована как эталонная при заключении различных электронных словарей, картотек, при автоматизированной классификации лингвистического материала.
Рекомендуемая область применения:
Образование.
Техническая характеристика:
Система АСМСА структурируется на два модуля и четыре блока:
- морфемный модуль - морфемная база данных, где анализируется морфная структура словоформ;
- словообразовательный модуль - словообразовательная база данных, где анализируется словообразовательная структура словоформ.
Каждый модуль состоит из двух блоков:
- блок-словарь;
- блок-анализатор.
Предполагается такая логика выполнения задач:
- заключения морфемного электронного словаря, на базе которого создается морфемный анализатор, выполняющего функцию лингвистического инструмента-классификатора в процессе заключения электронного словообразовательного словаря украинского языка, на базе которого строится система автоматизированного словообразовательного анализа.
Преимущества перед аналогами:
На сегодня завершена укладка морфемного электронного словаря, состоящего из трех подсистем:
1) список 170 тыс. слов украинского языка с определенными морфных структурами;
2) список аломорфичних корней (2500 корней)
3) список омонимичных корней (3100 корней).
Для всех остальных модулей АСМСА разработана теоретическая идеология, методология и программное обеспечение.
Стадия готовности разработки:
Готово к внедрению
Технико-экономический эффект:
Объем системы (170 тыс. слов) требует привлечения для работы лингвистов, программистов и дизайнеров. Реализация проекта требует также технических ресурсов: компьютеры с лицензионным программным обеспечением (С ++, RDBMS - MS Access, принтеры, расходные материалы, затраты на Интернет, копирование и бесплатное распространение 100 CD-комплектов АСМСА).
Будущее развитие проекта:
- заключить полный реестр словообразовательного словаря украинского языка на базе всех корней;
- создать автоматизированную систему для проведения морфемного и словообразовательного анализа на базе словоформ текста;
- создать автоматизированную систему синтеза морфных и словообразовательных структур слов украинского языка;
- заключить автоматизированный толковый словарь морфем украинского языка, что позволит смоделировать морфных структуру на семантической плоскости организации слова.
Описание разработки:
() Цель проекта заключается в создании автоматизированной системы морфемно-словообразовательного анализа украинского языка. Она структурируется на:
1) две базы данных: морфемную и словообразовательную, которые могут быть использованы как словари;
2) морфемный и словообразовательный анализаторы, которые рассматриваются как надежные лингвистические инструменты языковедческих исследований, способны работать в режимах поиска, классификации, морфемного и словообразовательного анализов языкового материала.
Задания проекта:
1) создать морфемную базу данных:
- верифицировать морфемную сегментацию 170 тыс. слов созданного морфемного словаря украинского языка;
- верифицировать базу данных аломорфичних корней;
- верифицировать базу данных омонимических корней;
- осуществить автоматизированные группировки лексики в совместно-афиксальных и однокоренных классах;
2) создать словообразовательную базу данных:
- осуществить автоматизированные группировки лексики в однокоренные классы;
- осуществить автоматизированную классификацию слов в пределах каждой однокоренной выборки по количественно-морфных моделями;
- построить словообразовательные гнезда.
3) объединить морфемную и словообразовательную базы данных в единую систему с удобным интерфейсом, которая будет доступна для широкого круга пользователей.
4) разработать пакет лингвистических алгоритмов и компьютерных программ для работы с АСМСА.
5) создать веб-страницу для АСМСА.
Результаты испытаний
Готово к внедрению
Возможность передачи за рубеж:
Реализация готовой продукции
Фотоприложение
Cтрана
Украина
За дополнительной информацией обращайтесь: E-mail: gal@uintei.kiev.ua
|