Детальная информация
Название | Identifying Trends in the Field of Computer Technologies Based on Patent Analysis Using NLP Approaches: выпускная квалификационная работа магистра: направление 45.04.04 «Интеллектуальные системы в гуманитарной среде» ; образовательная программа 45.04.04_01 «Цифровая лингвистика (международная образовательная программа)/Digital Linguistics (International Educational Program)» |
---|---|
Авторы | Захарова Екатерина Вячеславовна |
Научный руководитель | Коган Марина Самуиловна |
Организация | Санкт-Петербургский политехнический университет Петра Великого. Гуманитарный институт |
Выходные сведения | Санкт-Петербург, 2025 |
Коллекция | Выпускные квалификационные работы ; Общая коллекция |
Тематика | identifying trends ; patents ; topic modelling ; digital linguistics ; nlp ; выявление трендов ; патенты ; тематическое моделирование ; компьютерная лингвистика ; аот |
Тип документа | Выпускная квалификационная работа магистра |
Тип файла | |
Язык | Русский |
Уровень высшего образования | Магистратура |
Код специальности ФГОС | 45.04.04 |
Группа специальностей ФГОС | 450000 - Языкознание и литературоведение |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-4328 |
Права доступа | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Дополнительно | Новинка |
Ключ записи | ru\spstu\vkr\38954 |
Дата создания записи | 24.09.2025 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа | Анонимные пользователи |
---|---|
Сеть | Интернет |
The object of the research is patent documentation in the field of computer technologies. The subject of the research is the optimization of patent analysis using NLP approaches. The purpose of the research is to identify trends in the development of Russian computer technologies based on registered patents in the Russian Federation for 2014-2024. Research objectives: 1) To collect and analyze scientific literature and technical documentation on the master thesis topic; 2) To collect a corpus of patents in the field of computer technologies for the period from 2014 to 2024; 3) To pre-process and annotate the corpus; 4) To master tools and methods of patent analysis for identifying trends; 5) To analyze the dataset using NLP approaches; 6) To interpret and analyze the results of the experiment. The research methodologies include descriptive methods, comparative method, and experiment. As a result of the research, a program was created to clean up the patent data corpus and further topic modeling. A comparison of the results was carried out on enclosures of different sizes. This result allows us to analyze the directions of Russian computer technology development. To implement the practical part, Voyant, Google Colab, and the Rospatent database were used.
Объектом исследования является патентная документация в области компьютерных технологий. Предметом исследования является оптимизация патентного анализа с использованием методов АОТ. Целью исследования является выявление тенденций развития российских компьютерных технологий, основанных на зарегистрированных патентах на территории Российской Федерации за 2014–2024 годы. Задачи исследования: 1) Собрать и проанализировать научную литературу и техническую документацию по теме магистерской диссертации; 2) Собрать корпус патентов в области компьютерных технологий за период с 2014 по 2024 год; 3)Предварительно обработать и разметить корпус; 4) Освоить инструменты и методы патентного анализа для выявления тенденций; 5) Проанализировать набор данных с использованием подходов АОТ; 6) Проинтерпретировать и проанализировать результаты эксперимента. Для решения поставленных задач использованы следующие методы исследования: описательный метод, сравнительный метод, эксперимент. В результате исследования была создана программа для очистки корпуса патентных данных и дальнейшего тематического моделирования. Было проведено сравнение результатов на корпусах разного размера. Данный результат позволяет проанализировать направления развития компьютерных технологий. Для реализации практической части использовались Voyant, Google Colab, база данных Роспатент.
Место доступа | Группа пользователей | Действие |
---|---|---|
Локальная сеть ИБК СПбПУ | Все |
|
Интернет | Авторизованные пользователи СПбПУ |
|
Интернет | Анонимные пользователи |
|
Количество обращений: 0
За последние 30 дней: 0