Details

Title Разработка системы формирования базы знаний патентной информации с применением метода RAG: выпускная квалификационная работа бакалавра: направление 02.03.01 «Математика и компьютерные науки» ; образовательная программа 02.03.01_01 «Системы искусственного интеллекта и суперкомпьютерные технологии»
Creators Савенко Маргарита Вадимовна
Scientific adviser Лукашин Алексей Андреевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects патентная информация ; база знаний ; RAG ; эмбеддинги ; семантический поиск ; русскоязычные патенты ; онтология CPC ; поиск предшеству­ющего уровня техники ; векторизация ; patent information ; knowledge base ; embedding ; semantic search ; russian-language patents ; CPC ontology ; prior art ; vectorization
Document type Bachelor graduation qualification work
File type PDF
Language Russian
Level of education Bachelor
Speciality code (FGOS) 02.03.01
Speciality group (FGOS) 020000 - Компьютерные и информационные науки
DOI 10.18720/SPBPU/3/2025/vr/vr25-3050
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key ru\spstu\vkr\37293
Record create date 9/19/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

Предметом выпускной квалификационной работы является патентная ин­ формация и методы её структурирования для нужд интеллектуального поиска. Тема работы — разработка системы формирования базы знаний русскоязычных патентов с интеграцией в архитектуру RAG. Цель исследования заключается в снижении временных затрат патентного эксперта на поиск предшествующего уровня техники за счёт построения семантически релевантной базы знаний. В качестве методологии применяются подходы семантической векторизации текстов, онтологической фильтрации по классификатору CPC. В рамках работы реализо­ ван программный прототип формирования базы знаний, проведена интеграция с моделью RAG и экспериментальная оценка влияния качества базы на точность и полноту извлечения информации. Результаты показали, что обогащение базы знаний онтологической структурой и использование контекстуальных эмбеддингов повышают метрики релевантности в задачах семантического поиска. Разрабо­ танный подход может применяться для автоматизации аналитических задач в патентной экспертизе и снижает временные затраты специалистов.

The subject of the final qualifying thesis is patent information and methods of its structuring for the needs of intellectual search. The topic of the work is the development of a system for forming a knowledge base of Russian—language patents with integration into the RAG architecture. The purpose of the study is to reduce the time spent by a patent expert on searching for the prior art by building a semantically relevant knowledge base. The methodology uses the approaches of semantic vectorization of texts, ontological filtering by the CPC classifier. As part of the work, a software prototype for the formation of a knowledge base was implemented, integration with the RAG model was carried out, and an experimental assessment of the impact of database quality on the accuracy and completeness of information extraction was carried out. The results showed that enriching the knowledge base with an ontological structure and using contextual embeddings increase relevance metrics in semantic search tasks. The developed approach can be used to automate analytical tasks in patent examination and reduces the time spent by specialists.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous
  • Разработка системы формирования базы знаний патентной информации с применением метода RAG
    • Введение
    • 1. Анализ методов формирования патентных баз знаний на основе RAG
    • 2. Архитектура и реализация системы формирования базы знаний
    • 3. Экспериментальная оценка эффективности сформированной базы знаний
    • Заключение
    • Список использованных источников

Access count: 4 
Last 30 days: 4

Detailed usage statistics