Детальная информация

Название: Разработка программных систем автоматизации конспектирования профессиональных/учебных знаний: выпускная квалификационная работа бакалавра: направление 09.03.01 «Информатика и вычислительная техника» ; образовательная программа 09.03.01_02 «Технологии разработки программного обеспечения»
Авторы: Степанов Евгений Олегович
Научный руководитель: Малышев Игорь Алексеевич
Другие авторы: Нестеров Сергей Александрович
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2020
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: семантический анализ; знания; коллокация; конспектирование; корпус языка; лемматизация; сегментация; словоформа; синтаксическое сжатие; программная система; естественный язык; semantic analisys; knowledge; collection; inspection; language; lemmatization; segmentation; wordform; syntacic compression; software system; natural language
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Бакалавриат
Код специальности ФГОС: 09.03.01
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
Ссылки: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-807
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: ru\spstu\vkr\6404

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Тема выпускной работы: «Разработка программных систем автоматизации конспектирования профессиональных/учебных знаний» В выпускной квалификационной работе предлагается и развивается подход к конспектированию знаний, представленных в виде текстов на естественном языке. Основу этого подхода составляют методы семантического анализа и синтаксического сжатия текста. Семантика текста описывается с помощью модели семантических падежей. Синтаксическое сжатие производится посредством последовательного применения алгоритмов сегментации, лемматизации и коллокации. В качестве показателя эффективности конспектирования выбран коэффициент сжатия текста. В работе реализована программная система, автоматизирующая процесс конспектирования знаний. Программный код написан на языке Python с использованием специализированных библиотек анализа текстов. Работоспособность программной системы была проверена при обработке текстов лекций, относящихся к предметной области «Информационные технологии». При построении словаря словоформ был использован национальный корпус русского языка. Для оценки потребительских характеристик разработанной автоматизированной системы конспектирования был использован метод анонимного анкетного опроса пользователей. Статистический анализ результатов опроса показал преобладание положительных отзывов и позволил выбрать направления совершенствования системы.

Theme of graduation work: “Development of software systems for automating notes of professional and educational knowledge” In the final qualification work, an approach to taking notes of knowledge presented in the form of texts in natural language is proposed and developed. The basis of this approach is the methods of semantic analysis and syntactic compression of the text. The semantics of the text are described using the model of semantic cases. Syntactic compression is performed by sequentially applying segmentation, lemmatization and collocation algorithms. As an indicator of the effectiveness of notes, the compression ratio of the text is selected. The work implements a software system that automates the process of taking notes. The program code is written in Python using specialized text analysis libraries. The operability of the software system was tested during the processing of lecture texts related to the subject field “Information Technologies”. When building the dictionary of word forms, the national corpus of the Russian language was used. To assess the consumer characteristics of the developed automated note taking system, the method of anonymous questionnaire survey of users was used. Statistical analysis of the survey results showed the predominance of positive feedback and allowed us to choose areas for improving the system.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 27
За последние 30 дней: 0
Подробная статистика