Table | Card | RUSMARC | |
Allowed Actions: –
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group: Anonymous Network: Internet |
Annotation
Тема выпускной квалификационной работы: «Распознавание именованных сущностей в тексте». Распознавание именованных сущностей – одна из основных задач обработки естественного языка с широким применением в различных областях, суть которой заключается в извлечении из текста информации определенного типа – именованных сущностей. В ходе работы были рассмотрены основные методы решения этой задачи в тексте с использованием алгоритмов искусственного интеллекта. Оптимальным подходом было признано построение собственной нейронной сети с LSTM и CRF слоями. В ходе реализации были обучены и протестированы различные вариации моделей на основе этих слоев. Полученные модели были протестированы на одинаковом наборе данных, и было проведено сравнение их эффективности. В результате нейронная сеть на основе BiLSTM-CRF показала наилучшие результаты среди реализованных моделей. При этом показатели модели по различным метрикам классификации, таким как precision, recall и f1-score, сопоставимы с существующими решениями.
The subject of the graduate qualification work is “Named entity recognition in text”. Named entity recognition is one of the main natural language processing tasks with wide range of possible application in various fields. The essence of the task is extracting from text of special kind of information - named entities. Different artificial intelligence methods of dealing with this problem were reviewed during the work. Neural network based on LSTM and CRF was defined as an optimal approach for the task. Different model variations were considered during the implementation process. Implemented neural networks were tested on the same dataset and compared with each other. BiLSTM-CRF neural network showed best results on different main classification metrics, such as precision, recall and f1-score, and they were comparable with existing solutions.
Document access rights
Network | User group | Action | ||||
---|---|---|---|---|---|---|
ILC SPbPU Local Network | All | |||||
Internet | Authorized users SPbPU | |||||
Internet | Anonymous |
Usage statistics
Access count: 26
Last 30 days: 0 Detailed usage statistics |