СИСТЕМА АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИЙ ТЕКСТОВ DocSorter
Назначение разработки:
Система предназначена для нахождения признаков тематического или эмоционального класса текста.
Рекомендуемая область применения:
Новостные агентства и аналитические центры.
Техническая характеристика:
Операционная система Windows XP или более поздней.
Преимущества перед аналогами:
По сравнению с другими системами DocSorter ориентирован на работу с английским, украинским и русским языками. Благодаря использованию семантического анализа и, в частности, лексико-семантической базы UkrWordNet система ориентируется на содержательную близость между элементами текста, а не на непосредственный словарь текста.
Стадия готовности разработки:
Готово к внедрению
Описание разработки:
() Система определяет элементы текста, соответствующие определенным понятием. Это позволяет определить тематические элементы, имеющиеся в тексте, а с их помощью - темы текстов. Система учится на примерах текстов, собранных в тематических каталогах, поэтому может оценивать разнородные темы, такие как физика, математика, политика, спорт и тому подобное. При использовании наборов текстов, соответствующих эмоционально окрашенным обстоятельствам, например, отзывы на фильмы, алгоритм может быть использован для определения эмоциональной окраски текста.
Сведения о новизне разработки:
имеется патентов Украины -- 1 шт.
Результаты испытаний
Готово к внедрению
Возможность передачи за рубеж:
Совместное доведение до промыш. уровня Совместное произв.,продажа, эксплуатация
Фотоприложение
Cтрана
Украина
За дополнительной информацией обращайтесь: E-mail: gal@uintei.kiev.ua
|