Details
Title | Применение методов машинного обучения для построения графов знаний на основе спецификационных документов протокола SIP: выпускная квалификационная работа магистра: направление 09.04.03 «Прикладная информатика» ; образовательная программа 09.04.03_04 «Интеллектуальные технологии управления знаниями и данными» |
---|---|
Creators | Оборин Павел Андреевич |
Scientific adviser | Туральчук Константин Анатольевич |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий |
Imprint | Санкт-Петербург, 2022 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | Искусственный интеллект ; Графов теория ; Базы данных ; Программирования языки ; обработка естественного языка ; графы знаний ; протокол SIP ; natural language processing ; knowledge graphs ; SIP protocol |
UDC | 004.8 ; 519.17 ; 004.6 |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 09.04.03 |
Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
DOI | 10.18720/SPBPU/3/2022/vr/vr22-3703 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Record key | ru\spstu\vkr\18121 |
Record create date | 12/9/2022 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Данная работа посвящена применению методов обработки естественного языка для построения графа знаний. В ней на примере спецификации протокола SIP изложена методика построения графа знаний с применением библиотеки spaCy. Проведен анализ баз данных, используемых для хранения графовых структур. Разработаны средсва сбора и первичной обработки текстовых документов RFC, спроектирован алгоритм NLP-обработки для выделения триплетов субъект-предикат-объект, а также созданы утилиты для их хранения в базе данных Neo4j. На основе полученного графа знаний разработана информационная система для чтения RFC\,3261 с функцией интеллектуального поиска. Данная работа посвящена применению методов обработки естественного языка для построения графа знаний. В ней на примере спецификации протокола SIP изложена методика построения графа знаний с применением библиотеки spaCy. Проведен анализ баз данных, используемых для хранения графовых структур. Разработаны средсва сбора и первичной обработки текстовых документов RFC, спроектирован алгоритм NLP-обработки для выделения триплетов субъект-предикат-объект, а также созданы утилиты для их хранения в базе данных Neo4j. На основе полученного графа знаний разработана информационная система для чтения RFC\,3261 с функцией интеллектуального поиска.
This work is devoted to the application of natural language processing methods for constructing a knowledge graph. Using the SIP protocol specification as an example, it describes a method for constructing a knowledge graph using the spaCy library. The analysis of databases used for storing graph structures is carried out. RFC text document collection and primary processing environments have been developed, an NLP processing algorithm has been designed to isolate subject-predicate-object triplets, and utilities have been created for storing them in the Neo4j database. Based on the obtained knowledge graph, an information system for reading RFC\,3261 with an intelligent search function has been developed. This work is devoted to the application of natural language processing methods for constructing a knowledge graph. Using the SIP protocol specification as an example, it describes a method for constructing a knowledge graph using the spaCy library. The analysis of databases used for storing graph structures is carried out. RFC text document collection and primary processing environments have been developed, an NLP processing algorithm has been designed to isolate subject-predicate-object triplets, and utilities have been created to store them in the Neo4j database. Based on the obtained knowledge graph, an information system for reading RFC\,3261 with an intelligent search function has been developed.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
- Применение методов машинного обучения для построения графов знаний на основе спецификационных документов протокола SIP
- Введение
- 1. Описание предметной области
- 2. Методика построения графа знаний
- 3. Построение графа знаний и информационной системы на его основе
- 4. Анализ качества решения и тестирование системы
- Заключение
- Словарь терминов
- Список использованных источников
- Приложение 1. Исходный код для сбора начальных данных
- Приложение 2. Исходный код парсера RFC
- Приложение 3. Исходный код выделения сущностей из текста
- Приложение 4. Исходный код выделения связей между сущностями в тексте
- Приложение 5. Исходный код для разрешения отношений кореферентности
- Приложение 6. Исходный код для наполнения базы данных
- Приложение 7. Исходный код бэкенда
- Приложение 8. Исходный код фронтенда
Access count: 17
Last 30 days: 0