Таблица | Карточка | RUSMARC | |
Разрешенные действия: –
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа: Анонимные пользователи Сеть: Интернет |
Аннотация
В данной работе создается метод выделения именованных сущностей из новостных статей российских онлайн СМИ и определение на его основе тематических стоп-листов. Проводится анализ существующих систем распознавания именованных сущностей. Основное внимание уделяется скорости и качеству распознавания в NER-системах Pullenti SDK, Eureka Engine и Natasha. На основании этих данных заполняется база данных PostgreSQL и строятся списки стоп-листов.
In this paper, we create a method for extracting named entities from news articles of Russian online media and determine thematic stop lists based on them. The analysis of existing systems for the recognition of named entities. The main focus is on the speed and quality of recognition in the NER-systems Pullenti SDK, Eureka Engine and Natasha. Based on this data, the PostgreSQL database is populated and lists of stop lists are built.
Права на использование объекта хранения
Место доступа | Группа пользователей | Действие | ||||
---|---|---|---|---|---|---|
Локальная сеть ИБК СПбПУ | Все |
![]() ![]() ![]() |
||||
Внешние организации №2 | Все |
![]() |
||||
Внешние организации №1 | Все | |||||
Интернет | Авторизованные пользователи СПбПУ |
![]() ![]() ![]() |
||||
Интернет | Авторизованные пользователи (не СПбПУ, №2) |
![]() |
||||
Интернет | Авторизованные пользователи (не СПбПУ, №1) | |||||
![]() |
Интернет | Анонимные пользователи |
Статистика использования
|
Количество обращений: 25
За последние 30 дней: 0 Подробная статистика |