Details

Title Разработка программного инструмента для автоматизированного сбора информации в сети "Интернет" при подготовке датасетов для научных исследований: выпускная квалификационная работа магистра: направление 09.04.01 «Информатика и вычислительная техника» ; образовательная программа 09.04.01_15 «Технологии проектирования системного и прикладного программного обеспечения»
Creators Шеметов Степан Андреевич
Scientific adviser Семенов Константин Константинович
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2024
Collection Выпускные квалификационные работы; Общая коллекция
Subjects автоматизация; анализ научных работ; парсинг данных; веб-скрапер; automation; analysis of scientific works; data parsing; web scraper
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 09.04.01
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2024/vr/vr24-3937
Rights Доступ по паролю из сети Интернет (чтение)
Additionally New arrival
Record key ru\spstu\vkr\33156
Record create date 8/29/2024

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

Магистерская выпускная квалификационная работа посвящена исследованию автоматизации сбора и анализа научных статей на основе данных из внешних источников. Задачи исследования включали в себя следующее. 1. Проведение обзора и сравнение инструментов веб-скрапинга, с целью выявления их плюсов и минусов и основных функциональных возможностей. 2. Разработка алгоритмов автоматизированного сбора и анализа данных. 3. Разработка веб-скрапера для сбора и анализа данных научных работ. 4. Тестирование разработанного сервиса и оценка его эффективности. В рамках исследования был предложен метод автоматизированного сбора и анализа данных, который основан на использовании специализированного программного обеспечения для автоматического извлечения информации с веб-страниц и создания отчета на его основе. В ходе исследования был успешно реализован и протестирован предложенный метод. Разработанный инструмент существенно уменьшил необходимое время и усилия на этапах сбора и анализа данных, что стал значительным прогрессом в автоматизации и улучшении оптимизации научных исследований. В результате работы были представлены простые примеры использования программного средства, а также проведен анализ научных статей с его помощью. Выведены преимущества разработанного продукта, которые способствовали повышению скорости и качества процесса сбора и анализа данных в научных исследованиях.

The masters final qualifying thesis is devoted to the study of automation of collection and analysis of scientific articles based on data from external sources. The tasks of studying the features in themselves are as follows. 1. Review and compare web scraping tools in order to identify their pros and cons, as well as the main possible features. 2. Development of algorithms for automated data collection and analysis. 3. Development of a web scraper for collecting and analyzing data from scientific works. 4. Testing the developed service and assessing its effectiveness. As part of the study, a method of automated data collection and analysis was proposed, which is based on the use of specialized software to automatically extract information from web pages and create a report based on it. During the study, the proposed method was successfully implemented and tested. The developed tool significantly reduced the required time and effort during the data collection and analysis stages, which was a significant advance in automation and improved optimization of scientific research. As a result of the work, simple examples of using the software were presented, as well as an analysis of scientific articles using it. The advantages of the developed product are derived, which contributed to increasing the speed and quality of the process of collecting and analyzing data in scientific research.

Network User group Action
ILC SPbPU Local Network All
Read
Internet Authorized users SPbPU
Read
Internet Anonymous

Access count: 8 
Last 30 days: 5

Detailed usage statistics