Details
Title | Разработка программного комплекса для анализа текстовых данных в сети Интернет: выпускная квалификационная работа бакалавра: направление 02.03.02 «Фундаментальная информатика и информационные технологии» ; образовательная программа 02.03.02_02 «Информатика и компьютерные науки» |
---|---|
Creators | Дробязко Алексей Сергеевич |
Scientific adviser | Самочадин Александр Викторович |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Imprint | Санкт-Петербург, 2024 |
Collection | Выпускные квалификационные работы; Общая коллекция |
Subjects | обработка естественных языков; системы анализа текста; текстовый анализ; распознание сущностей; представления текста; natural language processing; text analysis systems; text mining; entity recognition; text representation |
Document type | Bachelor graduation qualification work |
File type | |
Language | Russian |
Level of education | Bachelor |
Speciality code (FGOS) | 02.03.02 |
Speciality group (FGOS) | 020000 - Компьютерные и информационные науки |
DOI | 10.18720/SPBPU/3/2024/vr/vr24-5102 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Additionally | New arrival |
Record key | ru\spstu\vkr\32572 |
Record create date | 8/28/2024 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Данная работа посвящена подбору архитектуры и разработке системы анализа текста для работы с данными, хранящимися в сети Интернет. Задачи, которые решались в ходе исследования: 1. Проведение анализа существующих решений. 2. Сбор функциональных и нефункциональных требования к разрабатываемому программному комплексу. 3. Изучение основ обработки естественных языков, текстового анализа. 4. Разработка архитектуры комплекса. 5. Разработка прототипа решения и его тестирование. 6. Провести анализ полученных результатов. Решение было разработано в виде программного комплекса, состоящего из нескольких модулей. В качестве технологий применялись языки Java и Type-script, фреймворки Spring и Angular. Сервис авторизации – Keycloak. В результате работы был спроектирован и разработан программный комплекс для анализа текстовых данных в сети Интернет. Данное решение может быть полезно в различных областях, работающих с большими объёмами текстовых данных.
The given work is devoted to development of system to work with textu-al data, stored in the Internet. The research set the following goals: 1. Analysis of existing solutions. 2. Gathering functional and nonfunctional requirements to develop software package. 3. Studying the basics of natural language processing, text analysis. 4. Software architecture development for software package. 5. Implementation and testing of prototype. 6. Analysis of research results and conclusion. Solution was developed in form of software package consisting of several dis-tinct modules. Technologies used: Java and Typescript as programming languages, Spring and Angular frameworks for backend and frontend. Keycloack used as authori-zation service. The study resulted in developed software package for text analysis in the Inter-net. Given solution may be useful in many applications requiring to work with large textual datasets.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 0
Last 30 days: 0