Details

Title: Автоматизация анализа текстовых документов на примере архива ответов органов социальной защиты: выпускная квалификационная работа бакалавра: направление 02.03.03 «Математическое обеспечение и администрирование информационных систем» ; образовательная программа 02.03.03_01 «Информационные системы и базы данных»
Creators: Филатова Ольга Евгеньевна
Scientific adviser: Сабинин Олег Юрьевич
Other creators: Пархоменко Владимир Андреевич
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2020
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: Text Mining; Oracle; Oracle Text; классификация текстовых документов; базы данных; classification of text documents; databases
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Level of education: Bachelor
Speciality code (FGOS): 02.03.03
Speciality group (FGOS): 020000 - Компьютерные и информационные науки
Links: Отзыв руководителя; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-2583
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: ru\spstu\vkr\8348

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

В данной работе изложен процесс разработки программы для классификации текстовых документов. В процессе работы разработан набор процедур на PL/SQL для подготовки обучающих данных, обучения классификатора и классификации новых документов. Также произведено исследование точности классификации документов и анализ времени работы программы на различных этапах. В качестве практической задачи рассмотрена задача классификации ответов органов социальной защиты на обращения граждан.

This work outlines the process of developing a program for the classification of text documents. In the process, a set of procedures was developed in PL/SQL for the preparation of training data, training the classifier and classification of new documents. Also a study of the accuracy of the classification of documents and analysis of the operating time of the program at various stages was made. As a practical task, the problem of classifying the responses of social protection authorities to citizens' appeals is considered.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Usage statistics

stat Access count: 14
Last 30 days: 1
Detailed usage statistics