Details

Title Разработка программного комплекса для анализа текстовых данных в сети Интернет: выпускная квалификационная работа бакалавра: направление 02.03.02 «Фундаментальная информатика и информационные технологии» ; образовательная программа 02.03.02_02 «Информатика и компьютерные науки»
Creators Дробязко Алексей Сергеевич
Scientific adviser Самочадин Александр Викторович
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2024
Collection Выпускные квалификационные работы; Общая коллекция
Subjects обработка естественных языков; системы анализа текста; текстовый анализ; распознание сущностей; представления текста; natural language processing; text analysis systems; text mining; entity recognition; text representation
Document type Bachelor graduation qualification work
File type PDF
Language Russian
Level of education Bachelor
Speciality code (FGOS) 02.03.02
Speciality group (FGOS) 020000 - Компьютерные и информационные науки
DOI 10.18720/SPBPU/3/2024/vr/vr24-5102
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key ru\spstu\vkr\32572
Record create date 8/28/2024

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

Данная работа посвящена подбору архитектуры и разработке системы анализа текста для работы с данными, хранящимися в сети Интернет. Задачи, которые решались в ходе исследования: 1. Проведение анализа существующих решений. 2. Сбор функциональных и нефункциональных требования к разрабатываемому программному комплексу. 3. Изучение основ обработки естественных языков, текстового анализа. 4. Разработка архитектуры комплекса. 5. Разработка прототипа решения и его тестирование. 6. Провести анализ полученных результатов. Решение было разработано в виде программного комплекса, состоящего из нескольких модулей. В качестве технологий применялись языки Java и Type-script, фреймворки Spring и Angular. Сервис авторизации – Keycloak. В результате работы был спроектирован и разработан программный комплекс для анализа текстовых данных в сети Интернет. Данное решение может быть полезно в различных областях, работающих с большими объёмами текстовых данных.

The given work is devoted to development of system to work with textu-al data, stored in the Internet. The research set the following goals: 1. Analysis of existing solutions. 2. Gathering functional and nonfunctional requirements to develop software package. 3. Studying the basics of natural language processing, text analysis. 4. Software architecture development for software package. 5. Implementation and testing of prototype. 6. Analysis of research results and conclusion. Solution was developed in form of software package consisting of several dis-tinct modules. Technologies used: Java and Typescript as programming languages, Spring and Angular frameworks for backend and frontend. Keycloack used as authori-zation service. The study resulted in developed software package for text analysis in the Inter-net. Given solution may be useful in many applications requiring to work with large textual datasets.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics