Детальная информация

Название Разработка программного инструмента для автоматизированного сбора информации в сети "Интернет" при подготовке датасетов для научных исследований: выпускная квалификационная работа магистра: направление 09.04.01 «Информатика и вычислительная техника» ; образовательная программа 09.04.01_15 «Технологии проектирования системного и прикладного программного обеспечения»
Авторы Шеметов Степан Андреевич
Научный руководитель Семенов Константин Константинович
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения Санкт-Петербург, 2024
Коллекция Выпускные квалификационные работы; Общая коллекция
Тематика автоматизация; анализ научных работ; парсинг данных; веб-скрапер; automation; analysis of scientific works; data parsing; web scraper
Тип документа Выпускная квалификационная работа магистра
Тип файла PDF
Язык Русский
Уровень высшего образования Магистратура
Код специальности ФГОС 09.04.01
Группа специальностей ФГОС 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2024/vr/vr24-3937
Права доступа Доступ по паролю из сети Интернет (чтение)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\33156
Дата создания записи 29.08.2024

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Магистерская выпускная квалификационная работа посвящена исследованию автоматизации сбора и анализа научных статей на основе данных из внешних источников. Задачи исследования включали в себя следующее. 1. Проведение обзора и сравнение инструментов веб-скрапинга, с целью выявления их плюсов и минусов и основных функциональных возможностей. 2. Разработка алгоритмов автоматизированного сбора и анализа данных. 3. Разработка веб-скрапера для сбора и анализа данных научных работ. 4. Тестирование разработанного сервиса и оценка его эффективности. В рамках исследования был предложен метод автоматизированного сбора и анализа данных, который основан на использовании специализированного программного обеспечения для автоматического извлечения информации с веб-страниц и создания отчета на его основе. В ходе исследования был успешно реализован и протестирован предложенный метод. Разработанный инструмент существенно уменьшил необходимое время и усилия на этапах сбора и анализа данных, что стал значительным прогрессом в автоматизации и улучшении оптимизации научных исследований. В результате работы были представлены простые примеры использования программного средства, а также проведен анализ научных статей с его помощью. Выведены преимущества разработанного продукта, которые способствовали повышению скорости и качества процесса сбора и анализа данных в научных исследованиях.

The masters final qualifying thesis is devoted to the study of automation of collection and analysis of scientific articles based on data from external sources. The tasks of studying the features in themselves are as follows. 1. Review and compare web scraping tools in order to identify their pros and cons, as well as the main possible features. 2. Development of algorithms for automated data collection and analysis. 3. Development of a web scraper for collecting and analyzing data from scientific works. 4. Testing the developed service and assessing its effectiveness. As part of the study, a method of automated data collection and analysis was proposed, which is based on the use of specialized software to automatically extract information from web pages and create a report based on it. During the study, the proposed method was successfully implemented and tested. The developed tool significantly reduced the required time and effort during the data collection and analysis stages, which was a significant advance in automation and improved optimization of scientific research. As a result of the work, simple examples of using the software were presented, as well as an analysis of scientific articles using it. The advantages of the developed product are derived, which contributed to increasing the speed and quality of the process of collecting and analyzing data in scientific research.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать
Интернет Авторизованные пользователи СПбПУ
Прочитать
Интернет Анонимные пользователи

Количество обращений: 8 
За последние 30 дней: 5

Подробная статистика