Details

Title Применение методов машинного обучения для построения графов знаний на основе спецификационных документов протокола SIP: выпускная квалификационная работа магистра: направление 09.04.03 «Прикладная информатика» ; образовательная программа 09.04.03_04 «Интеллектуальные технологии управления знаниями и данными»
Creators Оборин Павел Андреевич
Scientific adviser Туральчук Константин Анатольевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint Санкт-Петербург, 2022
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects Искусственный интеллект ; Графов теория ; Базы данных ; Программирования языки ; обработка естественного языка ; графы знаний ; протокол SIP ; natural language processing ; knowledge graphs ; SIP protocol
UDC 004.8 ; 519.17 ; 004.6
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 09.04.03
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2022/vr/vr22-3703
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key ru\spstu\vkr\18121
Record create date 12/9/2022

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

Данная работа посвящена применению методов обработки естественного языка для построения графа знаний. В ней на примере спецификации протокола SIP изложена методика построения графа знаний с применением библиотеки spaCy. Проведен анализ баз данных, используемых для хранения графовых структур. Разработаны средсва сбора и первичной обработки текстовых документов RFC, спроектирован алгоритм NLP-обработки для выделения триплетов субъект-предикат-объект, а также созданы утилиты для их хранения в базе данных Neo4j. На основе полученного графа знаний разработана информационная система для чтения RFC\,3261 с функцией интеллектуального поиска. Данная работа посвящена применению методов обработки естественного языка для построения графа знаний. В ней на примере спецификации протокола SIP изложена методика построения графа знаний с применением библиотеки spaCy. Проведен анализ баз данных, используемых для хранения графовых структур. Разработаны средсва сбора и первичной обработки текстовых документов RFC, спроектирован алгоритм NLP-обработки для выделения триплетов субъект-предикат-объект, а также созданы утилиты для их хранения в базе данных Neo4j. На основе полученного графа знаний разработана информационная система для чтения RFC\,3261 с функцией интеллектуального поиска.

This work is devoted to the application of natural language processing methods for constructing a knowledge graph. Using the SIP protocol specification as an example, it describes a method for constructing a knowledge graph using the spaCy library. The analysis of databases used for storing graph structures is carried out. RFC text document collection and primary processing environments have been developed, an NLP processing algorithm has been designed to isolate subject-predicate-object triplets, and utilities have been created for storing them in the Neo4j database. Based on the obtained knowledge graph, an information system for reading RFC\,3261 with an intelligent search function has been developed. This work is devoted to the application of natural language processing methods for constructing a knowledge graph. Using the SIP protocol specification as an example, it describes a method for constructing a knowledge graph using the spaCy library. The analysis of databases used for storing graph structures is carried out. RFC text document collection and primary processing environments have been developed, an NLP processing algorithm has been designed to isolate subject-predicate-object triplets, and utilities have been created to store them in the Neo4j database. Based on the obtained knowledge graph, an information system for reading RFC\,3261 with an intelligent search function has been developed.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous
  • Применение методов машинного обучения для построения графов знаний на основе спецификационных документов протокола SIP
    • Введение
    • 1. Описание предметной области
    • 2. Методика построения графа знаний
    • 3. Построение графа знаний и информационной системы на его основе
    • 4. Анализ качества решения и тестирование системы
    • Заключение
    • Словарь терминов
    • Список использованных источников
    • Приложение 1. Исходный код для сбора начальных данных
    • Приложение 2. Исходный код парсера RFC
    • Приложение 3. Исходный код выделения сущностей из текста
    • Приложение 4. Исходный код выделения связей между сущностями в тексте
    • Приложение 5. Исходный код для разрешения отношений кореферентности
    • Приложение 6. Исходный код для наполнения базы данных
    • Приложение 7. Исходный код бэкенда
    • Приложение 8. Исходный код фронтенда

Access count: 17 
Last 30 days: 0

Detailed usage statistics