Details
Title | Identifying Trends in the Field of Computer Technologies Based on Patent Analysis Using NLP Approaches: выпускная квалификационная работа магистра: направление 45.04.04 «Интеллектуальные системы в гуманитарной среде» ; образовательная программа 45.04.04_01 «Цифровая лингвистика (международная образовательная программа)/Digital Linguistics (International Educational Program)» |
---|---|
Creators | Захарова Екатерина Вячеславовна |
Scientific adviser | Коган Марина Самуиловна |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Гуманитарный институт |
Imprint | Санкт-Петербург, 2025 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | identifying trends ; patents ; topic modelling ; digital linguistics ; nlp ; выявление трендов ; патенты ; тематическое моделирование ; компьютерная лингвистика ; аот |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 45.04.04 |
Speciality group (FGOS) | 450000 - Языкознание и литературоведение |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-4328 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Additionally | New arrival |
Record key | ru\spstu\vkr\38954 |
Record create date | 9/24/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
The object of the research is patent documentation in the field of computer technologies. The subject of the research is the optimization of patent analysis using NLP approaches. The purpose of the research is to identify trends in the development of Russian computer technologies based on registered patents in the Russian Federation for 2014-2024. Research objectives: 1) To collect and analyze scientific literature and technical documentation on the master thesis topic; 2) To collect a corpus of patents in the field of computer technologies for the period from 2014 to 2024; 3) To pre-process and annotate the corpus; 4) To master tools and methods of patent analysis for identifying trends; 5) To analyze the dataset using NLP approaches; 6) To interpret and analyze the results of the experiment. The research methodologies include descriptive methods, comparative method, and experiment. As a result of the research, a program was created to clean up the patent data corpus and further topic modeling. A comparison of the results was carried out on enclosures of different sizes. This result allows us to analyze the directions of Russian computer technology development. To implement the practical part, Voyant, Google Colab, and the Rospatent database were used.
Объектом исследования является патентная документация в области компьютерных технологий. Предметом исследования является оптимизация патентного анализа с использованием методов АОТ. Целью исследования является выявление тенденций развития российских компьютерных технологий, основанных на зарегистрированных патентах на территории Российской Федерации за 2014–2024 годы. Задачи исследования: 1) Собрать и проанализировать научную литературу и техническую документацию по теме магистерской диссертации; 2) Собрать корпус патентов в области компьютерных технологий за период с 2014 по 2024 год; 3)Предварительно обработать и разметить корпус; 4) Освоить инструменты и методы патентного анализа для выявления тенденций; 5) Проанализировать набор данных с использованием подходов АОТ; 6) Проинтерпретировать и проанализировать результаты эксперимента. Для решения поставленных задач использованы следующие методы исследования: описательный метод, сравнительный метод, эксперимент. В результате исследования была создана программа для очистки корпуса патентных данных и дальнейшего тематического моделирования. Было проведено сравнение результатов на корпусах разного размера. Данный результат позволяет проанализировать направления развития компьютерных технологий. Для реализации практической части использовались Voyant, Google Colab, база данных Роспатент.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 0
Last 30 days: 0