Детальная информация
Название | Разработка системы формирования базы знаний патентной информации с применением метода RAG: выпускная квалификационная работа бакалавра: направление 02.03.01 «Математика и компьютерные науки» ; образовательная программа 02.03.01_01 «Системы искусственного интеллекта и суперкомпьютерные технологии» |
---|---|
Авторы | Савенко Маргарита Вадимовна |
Научный руководитель | Лукашин Алексей Андреевич |
Организация | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Выходные сведения | Санкт-Петербург, 2025 |
Коллекция | Выпускные квалификационные работы ; Общая коллекция |
Тематика | патентная информация ; база знаний ; RAG ; эмбеддинги ; семантический поиск ; русскоязычные патенты ; онтология CPC ; поиск предшествующего уровня техники ; векторизация ; patent information ; knowledge base ; embedding ; semantic search ; russian-language patents ; CPC ontology ; prior art ; vectorization |
Тип документа | Выпускная квалификационная работа бакалавра |
Тип файла | |
Язык | Русский |
Уровень высшего образования | Бакалавриат |
Код специальности ФГОС | 02.03.01 |
Группа специальностей ФГОС | 020000 - Компьютерные и информационные науки |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-3050 |
Права доступа | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Дополнительно | Новинка |
Ключ записи | ru\spstu\vkr\37293 |
Дата создания записи | 19.09.2025 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа | Анонимные пользователи |
---|---|
Сеть | Интернет |
Предметом выпускной квалификационной работы является патентная ин формация и методы её структурирования для нужд интеллектуального поиска. Тема работы — разработка системы формирования базы знаний русскоязычных патентов с интеграцией в архитектуру RAG. Цель исследования заключается в снижении временных затрат патентного эксперта на поиск предшествующего уровня техники за счёт построения семантически релевантной базы знаний. В качестве методологии применяются подходы семантической векторизации текстов, онтологической фильтрации по классификатору CPC. В рамках работы реализо ван программный прототип формирования базы знаний, проведена интеграция с моделью RAG и экспериментальная оценка влияния качества базы на точность и полноту извлечения информации. Результаты показали, что обогащение базы знаний онтологической структурой и использование контекстуальных эмбеддингов повышают метрики релевантности в задачах семантического поиска. Разрабо танный подход может применяться для автоматизации аналитических задач в патентной экспертизе и снижает временные затраты специалистов.
The subject of the final qualifying thesis is patent information and methods of its structuring for the needs of intellectual search. The topic of the work is the development of a system for forming a knowledge base of Russian—language patents with integration into the RAG architecture. The purpose of the study is to reduce the time spent by a patent expert on searching for the prior art by building a semantically relevant knowledge base. The methodology uses the approaches of semantic vectorization of texts, ontological filtering by the CPC classifier. As part of the work, a software prototype for the formation of a knowledge base was implemented, integration with the RAG model was carried out, and an experimental assessment of the impact of database quality on the accuracy and completeness of information extraction was carried out. The results showed that enriching the knowledge base with an ontological structure and using contextual embeddings increase relevance metrics in semantic search tasks. The developed approach can be used to automate analytical tasks in patent examination and reduces the time spent by specialists.
Место доступа | Группа пользователей | Действие |
---|---|---|
Локальная сеть ИБК СПбПУ | Все |
|
Интернет | Авторизованные пользователи СПбПУ |
|
Интернет | Анонимные пользователи |
|
- Разработка системы формирования базы знаний патентной информации с применением метода RAG
- Введение
- 1. Анализ методов формирования патентных баз знаний на основе RAG
- 2. Архитектура и реализация системы формирования базы знаний
- 3. Экспериментальная оценка эффективности сформированной базы знаний
- Заключение
- Список использованных источников
Количество обращений: 4
За последние 30 дней: 4