Детальная информация

Название: Интеллектуальное распознавание именованных сущностей в тексте: выпускная квалификационная работа бакалавра: направление 09.03.04 «Программная инженерия» ; образовательная программа 09.03.04_01 «Технология разработки и сопровождения качественного программного продукта»
Авторы: Альмухаметов Рустам Уралович
Научный руководитель: Селин Иван Андреевич
Другие авторы: Локшина Екатерина Геннадиевна
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2021
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: искусственный интеллект; машинное обучение; глубокое обучение; нейронные сети; обработка естественного языка; распознавание именованных сущностей; artificial intelligence; machine learning; deep learning; neural networks; natural language processing; named entity recognition
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Бакалавриат
Код специальности ФГОС: 09.03.04
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
Ссылки: Отзыв руководителя; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2021/vr/vr21-806
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: ru\spstu\vkr\12751

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Тема выпускной квалификационной работы: «Распознавание именованных сущностей в тексте». Распознавание именованных сущностей – одна из основных задач обработки естественного языка с широким применением в различных областях, суть которой заключается в извлечении из текста информации определенного типа – именованных сущностей. В ходе работы были рассмотрены основные методы решения этой задачи в тексте с использованием алгоритмов искусственного интеллекта. Оптимальным подходом было признано построение собственной нейронной сети с LSTM и CRF слоями. В ходе реализации были обучены и протестированы различные вариации моделей на основе этих слоев. Полученные модели были протестированы на одинаковом наборе данных, и было проведено сравнение их эффективности. В результате нейронная сеть на основе BiLSTM-CRF показала наилучшие результаты среди реализованных моделей. При этом показатели модели по различным метрикам классификации, таким как precision, recall и f1-score, сопоставимы с существующими решениями.

The subject of the graduate qualification work is “Named entity recognition in text”. Named entity recognition is one of the main natural language processing tasks with wide range of possible application in various fields. The essence of the task is extracting from text of special kind of information - named entities. Different artificial intelligence methods of dealing with this problem were reviewed during the work. Neural network based on LSTM and CRF was defined as an optimal approach for the task. Different model variations were considered during the implementation process. Implemented neural networks were tested on the same dataset and compared with each other. BiLSTM-CRF neural network showed best results on different main classification metrics, such as precision, recall and f1-score, and they were comparable with existing solutions.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 28
За последние 30 дней: 0
Подробная статистика