АВТОМАТИЗОВАНА СИСТЕМА МОРФЕМНО-СЛОВОТВОРЧОГО АНАЛІЗУ СЛІВ УКРАЇНСЬКОЇ МОВИ
Призначення розробки:
Система представляє великий лексичний матеріал (170 тис. слів), що дозволяє говорити про повноту лінгвістичного опису морфемної і словотворчої систем української мови.
Розроблено методику і методологію конструювання системи, а також формалізація опису морфів, морфних і словотворчих структур може бути використана як еталонна при укладанні різних електронних словників, картотек, при автоматизованій класифікації лінгвістичного матеріалу.
Рекомендована область застосування:
Освіта.
Технічна характеристика:
Система структурується на два модулі і чотири блоки:
- морфемний модуль - морфемна база даних, де аналізується морфна структура словоформ;
- словотворчий модуль - словотворча база даних, де аналізується словотворча структура словоформ.
Кожен модуль складається з двох блоків:
- блок-словник;
- блок-аналізатор.
Передбачається така логіка виконання завдань:
- укладення морфемного електронного словника, на базі якого створюється морфемний аналізатор, що виконує функцію лінгвістичного інструменту-класифікатора в процесі укладення електронного словотворного словника української мови, на базі якого будується система автоматизованого словотворного аналізу.
Переваги перед аналогами:
На сьогодні завершено укладання морфемного електронного словника, що складається з трьох підсистем:
1) список 170 тис. слів української мови з певними морфними структурами;
2) список аломорфічніх коренів (2500 коренів)
3) список омонімічних коренів (3100 коренів).
Для всіх інших модулів системи розроблена теоретична ідеологія, методологія і програмне забезпечення.
Стадія завершеності розробки:
Підготовлено до впровадження
Техніко-економічний ефект:
Обсяг системи (170 тис. слів) вимагає залучення для роботи лінгвістів, програмістів і дизайнерів. Реалізація проекту вимагає також технічних ресурсів: комп'ютери з ліцензійним програмним забезпеченням (С ++, RDBMS - MS Access, принтери, витратні матеріали, витрати на Інтернет, копіювання та безкоштовне розповсюдження 100 CD-комплектів системи).
Майбутній розвиток проекту:
- укласти повний реєстр словотвірного словника української мови на базі всіх коренів;
- створити автоматизовану систему для проведення морфемного і словотвірного аналізу на базі словоформ тексту;
- створити автоматизовану систему синтезу морфних і словотворчих структур слів української мови;
- укласти автоматизований тлумачний словник морфем української мови, що дозволить змоделювати морфну структуру на семантичній площині організації слова.
Опис розробки:
() Мета проекту полягає у створенні автоматизованої системи морфемно-словотвірного аналізу української мови. Вона структурується на:
1) дві бази даних: морфемну і словотворчу, які можуть бути використані як словники;
2) морфемний і словотворчий аналізатори, які розглядаються як надійні лінгвістичні інструменти мовознавчих досліджень, здатні працювати в режимах пошуку, класифікації, морфемного і словотвірного аналізів мовного матеріалу.
Завдання проекту:
1) створити морфемну базу даних:
- верифікувати морфемну сегментацію 170 тис. слів створеного морфемного словника української мови;
- верифікувати базу даних аломорфічніх коренів;
- верифікувати базу даних омонімічних коренів;
- здійснити автоматизовані угруповання лексики в спільно-афіксальних і однокореневих класах;
2) створити словообразовательную базу даних:
- здійснити автоматизовані угруповання лексики в однокореневі класи;
- здійснити автоматизовану класифікацію слів в межах кожної однокореневої вибірки за кількісно-морфними моделями;
- побудувати словотворчі гнізда.
3) об'єднати морфемну і словотворчу бази даних в єдину систему з зручним інтерфейсом, яка буде доступна для широкого кола користувачів.
4) розробити пакет лінгвістичних алгоритмів і комп'ютерних програм для роботи з АЗМЗ.
5) створити веб-сторінку для АЗМЗ.
Результати дослiджень
Готове до впровадження
Можливість передачі за кордон:
Реалізація готової продукції
Фотодоповнення
Країна
Україна
Для отримання додаткової інформації звертайтесь:: E-mail: gal@uintei.kiev.ua
|