Details

Title: Интеллектуальное распознавание именованных сущностей в тексте: выпускная квалификационная работа бакалавра: направление 09.03.04 «Программная инженерия» ; образовательная программа 09.03.04_01 «Технология разработки и сопровождения качественного программного продукта»
Creators: Альмухаметов Рустам Уралович
Scientific adviser: Селин Иван Андреевич
Other creators: Локшина Екатерина Геннадиевна
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2021
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: искусственный интеллект; машинное обучение; глубокое обучение; нейронные сети; обработка естественного языка; распознавание именованных сущностей; artificial intelligence; machine learning; deep learning; neural networks; natural language processing; named entity recognition
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Level of education: Bachelor
Speciality code (FGOS): 09.03.04
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
Links: Отзыв руководителя; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2021/vr/vr21-806
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: ru\spstu\vkr\12751

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Тема выпускной квалификационной работы: «Распознавание именованных сущностей в тексте». Распознавание именованных сущностей – одна из основных задач обработки естественного языка с широким применением в различных областях, суть которой заключается в извлечении из текста информации определенного типа – именованных сущностей. В ходе работы были рассмотрены основные методы решения этой задачи в тексте с использованием алгоритмов искусственного интеллекта. Оптимальным подходом было признано построение собственной нейронной сети с LSTM и CRF слоями. В ходе реализации были обучены и протестированы различные вариации моделей на основе этих слоев. Полученные модели были протестированы на одинаковом наборе данных, и было проведено сравнение их эффективности. В результате нейронная сеть на основе BiLSTM-CRF показала наилучшие результаты среди реализованных моделей. При этом показатели модели по различным метрикам классификации, таким как precision, recall и f1-score, сопоставимы с существующими решениями.

The subject of the graduate qualification work is “Named entity recognition in text”. Named entity recognition is one of the main natural language processing tasks with wide range of possible application in various fields. The essence of the task is extracting from text of special kind of information - named entities. Different artificial intelligence methods of dealing with this problem were reviewed during the work. Neural network based on LSTM and CRF was defined as an optimal approach for the task. Different model variations were considered during the implementation process. Implemented neural networks were tested on the same dataset and compared with each other. BiLSTM-CRF neural network showed best results on different main classification metrics, such as precision, recall and f1-score, and they were comparable with existing solutions.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Usage statistics

stat Access count: 26
Last 30 days: 0
Detailed usage statistics