Details

Title: Разработка программных систем автоматизации конспектирования профессиональных/учебных знаний: выпускная квалификационная работа бакалавра: направление 09.03.01 «Информатика и вычислительная техника» ; образовательная программа 09.03.01_02 «Технологии разработки программного обеспечения»
Creators: Степанов Евгений Олегович
Scientific adviser: Малышев Игорь Алексеевич
Other creators: Нестеров Сергей Александрович
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2020
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: семантический анализ; знания; коллокация; конспектирование; корпус языка; лемматизация; сегментация; словоформа; синтаксическое сжатие; программная система; естественный язык; semantic analisys; knowledge; collection; inspection; language; lemmatization; segmentation; wordform; syntacic compression; software system; natural language
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Level of education: Bachelor
Speciality code (FGOS): 09.03.01
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
Links: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-807
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: ru\spstu\vkr\6404

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Тема выпускной работы: «Разработка программных систем автоматизации конспектирования профессиональных/учебных знаний» В выпускной квалификационной работе предлагается и развивается подход к конспектированию знаний, представленных в виде текстов на естественном языке. Основу этого подхода составляют методы семантического анализа и синтаксического сжатия текста. Семантика текста описывается с помощью модели семантических падежей. Синтаксическое сжатие производится посредством последовательного применения алгоритмов сегментации, лемматизации и коллокации. В качестве показателя эффективности конспектирования выбран коэффициент сжатия текста. В работе реализована программная система, автоматизирующая процесс конспектирования знаний. Программный код написан на языке Python с использованием специализированных библиотек анализа текстов. Работоспособность программной системы была проверена при обработке текстов лекций, относящихся к предметной области «Информационные технологии». При построении словаря словоформ был использован национальный корпус русского языка. Для оценки потребительских характеристик разработанной автоматизированной системы конспектирования был использован метод анонимного анкетного опроса пользователей. Статистический анализ результатов опроса показал преобладание положительных отзывов и позволил выбрать направления совершенствования системы.

Theme of graduation work: “Development of software systems for automating notes of professional and educational knowledge” In the final qualification work, an approach to taking notes of knowledge presented in the form of texts in natural language is proposed and developed. The basis of this approach is the methods of semantic analysis and syntactic compression of the text. The semantics of the text are described using the model of semantic cases. Syntactic compression is performed by sequentially applying segmentation, lemmatization and collocation algorithms. As an indicator of the effectiveness of notes, the compression ratio of the text is selected. The work implements a software system that automates the process of taking notes. The program code is written in Python using specialized text analysis libraries. The operability of the software system was tested during the processing of lecture texts related to the subject field “Information Technologies”. When building the dictionary of word forms, the national corpus of the Russian language was used. To assess the consumer characteristics of the developed automated note taking system, the method of anonymous questionnaire survey of users was used. Statistical analysis of the survey results showed the predominance of positive feedback and allowed us to choose areas for improving the system.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Usage statistics

stat Access count: 27
Last 30 days: 0
Detailed usage statistics