Details

Title Разработка программного средства протоколирования совещаний: выпускная квалификационная работа бакалавра: направление 02.03.02 «Фундаментальная информатика и информационные технологии» ; образовательная программа 02.03.02_02 «Информатика и компьютерные науки»
Creators Титов Федор Михайлович
Scientific adviser Самочадин Александр Викторович
Other creators Локшина Екатерина Геннадиевна
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint Санкт-Петербург, 2021
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects обработка естественного языка ; тематическая сегментация ; автоматическое реферирование ; семантическая схожесть текстов ; система формирования протокола совещания ; natural language processing ; topic segmentation ; summarization ; text similarity ; system for generating the meeting minutes
Document type Bachelor graduation qualification work
File type PDF
Language Russian
Level of education Bachelor
Speciality code (FGOS) 02.03.02
Speciality group (FGOS) 020000 - Компьютерные и информационные науки
Links Отзыв руководителя ; Отчет о проверке на объем и корректность внешних заимствований
DOI 10.18720/SPBPU/3/2021/vr/vr21-3907
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key ru\spstu\vkr\14215
Record create date 9/7/2021

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

В данной работе рассматривается задача автоматического формирования протокола совещания, а также методы и алгоритмы обработки естественного языка. Приведен обзор существующих систем формирования протокола. Целью работы является проектирование системы автоматического формирования протокола совещания на основе текста стенограммы совещания и других дополнительных документов. Для решения задачи был предложен подход, включающий в себя использование языка регулярных выражений, алгоритмов тематической сегментации текста, автоматического реферирования и определения степени семантической близости текстов. Далее система была реализована с использованием языка программирования Python. Реализованная система была протестирована на соответствие указанным требованиями критериям. Результат данной работы представляет собой продукт, который может быть использован как самостоятельное решение, так и как дополнительный модуль в системе стенографирования совещаний.

This paper considers the problem of automatic generation of the meeting minutes, as well as methods and algorithms for processing natural language. An overview of the existing systems for the for-mation of the protocol is given.The aim of the work is to design the meeting minutes automatic generation system based on the text of the transcript of the meeting and other additional documents.To solve the problem, an approach was proposed that includes the use of a regular expression language, algorithms for topictext segmen-tation, summarization and calculating of textssimilarity. Further, the system was implemented using the Python programming language. The implemented system has been tested for compliance with the specified requirements and criteria. The result of this work is aprogram system that can be used both as an independent solution and as an additional module in the meeting transcript system.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous

Access count: 8 
Last 30 days: 0

Detailed usage statistics