Details

Title Identifying Trends in the Field of Computer Technologies Based on Patent Analysis Using NLP Approaches: выпускная квалификационная работа магистра: направление 45.04.04 «Интеллектуальные системы в гуманитарной среде» ; образовательная программа 45.04.04_01 «Цифровая лингвистика (международная образовательная программа)/Digital Linguistics (International Educational Program)»
Creators Захарова Екатерина Вячеславовна
Scientific adviser Коган Марина Самуиловна
Organization Санкт-Петербургский политехнический университет Петра Великого. Гуманитарный институт
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects identifying trends ; patents ; topic modelling ; digital linguistics ; nlp ; выявление трендов ; патенты ; тематическое моделирование ; компьютерная лингвистика ; аот
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 45.04.04
Speciality group (FGOS) 450000 - Языкознание и литературоведение
DOI 10.18720/SPBPU/3/2025/vr/vr25-4328
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key ru\spstu\vkr\38954
Record create date 9/24/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

The object of the research is patent documentation in the field of computer technologies. The subject of the research is the optimization of patent analysis using NLP approaches. The purpose of the research is to identify trends in the development of Russian computer technologies based on registered patents in the Russian Federation for 2014-2024. Research objectives: 1) To collect and analyze scientific literature and technical documentation on the master thesis topic; 2) To collect a corpus of patents in the field of computer technologies for the period from 2014 to 2024; 3) To pre-process and annotate the corpus; 4) To master tools and methods of patent analysis for identifying trends; 5) To analyze the dataset using NLP approaches; 6) To interpret and analyze the results of the experiment. The research methodologies include descriptive methods, comparative method, and experiment. As a result of the research, a program was created to clean up the patent data corpus and further topic modeling. A comparison of the results was carried out on enclosures of different sizes. This result allows us to analyze the directions of Russian computer technology development. To implement the practical part, Voyant, Google Colab, and the Rospatent database were used.

Объектом исследования является патентная документация в области компьютерных технологий. Предметом исследования является оптимизация патентного анализа с использованием методов АОТ. Целью исследования является выявление тенденций развития российских компьютерных технологий, основанных на зарегистрированных патентах на территории Российской Федерации за 2014–2024 годы. Задачи исследования:  1) Собрать и проанализировать научную литературу и техническую документацию по теме магистерской диссертации; 2) Собрать корпус патентов в области компьютерных технологий за период с 2014 по 2024 год; 3)Предварительно обработать и разметить корпус; 4) Освоить инструменты и методы патентного анализа для выявления тенденций; 5) Проанализировать набор данных с использованием подходов АОТ; 6) Проинтерпретировать и проанализировать результаты эксперимента. Для решения поставленных задач использованы следующие методы исследования: описательный метод, сравнительный метод, эксперимент. В результате исследования была создана программа для очистки корпуса патентных данных и дальнейшего тематического моделирования. Было проведено сравнение результатов на корпусах разного размера. Данный результат позволяет проанализировать направления развития компьютерных технологий. Для реализации практической части использовались Voyant, Google Colab, база данных Роспатент.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics