Table | Card | RUSMARC | |
Allowed Actions: –
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group: Anonymous Network: Internet |
Annotation
Данная работа посвящена разработке автоматического многозначного класси-фикатора текстов, предназначенного для эффективной обработки и категори-зации аннотаций научных статей. В ходе выполнения работы были изучены и сравнены различные методы многозначной классификации, также были оценены возможности и ограни-чения каждого из методов с точки зрения точности, скорости обработки и способности к масштабированию. Проведен анализ и предобработка исходно-го датасета, включающего аннотации научных статей из базы данных PubMed. Разработана и оптимизирована модель, основанная на адаптированной для выполнения задач многозначной классификации архитектуре трансформер. Реализованная модель успешно применена для автоматического многозначно-го классифицирования текстов аннотаций научных статей, демонстрируя от-личные результаты по всем выбранным метрикам оценки производительно-сти. Предложены направления для дальнейшего развития исследования.
This work is dedicated to the development of an automatic multilabel text classifier designed for efficient processing and categorization of scientific article annotations. In the course of the work, various multilabel classification methods were ex-plored and compared, and the capabilities and limitations of each method were as-sessed in terms of accuracy, processing speed, and scalability. An analysis and pre-processing of the original dataset, which includes annotations of scientific articles from the PubMed database, were conducted. A model based on a transformer archi-tecture adapted for multilabel classification tasks was developed and optimized. The implemented model was successfully applied to the automatic multilabel classifica-tion of text annotations of scientific articles, demonstrating excellent results across all selected performance evaluation metrics. Directions for further research development have been proposed.
Document access rights
Network | User group | Action | ||||
---|---|---|---|---|---|---|
ILC SPbPU Local Network | All |
![]() ![]() ![]() |
||||
Internet | Authorized users SPbPU |
![]() ![]() ![]() |
||||
![]() |
Internet | Anonymous |
Usage statistics
|
Access count: 0
Last 30 days: 0 Detailed usage statistics |