Details

Title: Разработка сервиса для оценки удобочитаемости текста с применением технологий машинного обучения // Системный анализ в проектировании и управлении: сборник научных трудов XXVI Международной научно-практической конференции, 13–14 октября 2022 года: [в 3 частях]. Ч. 2
Creators: Никулина Елизавета Романовна; Черкас Алина Владимировна; Козина Екатерина Дмитриевна; Бойко Анна Владимировна; Дмитриева Лидия Алексеевна
Organization: Санкт-Петербургский политехнический университет Петра Великого. Центр Национальной технологической инициативы. Лаборатория «Промышленные системы потоковой обработки данных»
Imprint: Санкт-Петербург: ПОЛИТЕХ-ПРЕСС, 2023
Collection: Общая коллекция
Subjects: Машинное обучение; Нейронные сети; удобочитаемость; градиентный бустинг; readability; gradient boosting
UDC: 004.85; 004.032.26
Document type: Article, report
File type: PDF
Language: Russian
DOI: 10.18720/SPBPU/2/id23-103
Rights: Свободный доступ из сети Интернет (чтение, печать, копирование)
Record key: RU\SPSTU\edoc\70864

Allowed Actions: Read Download (0.5 Mb)

Group: Anonymous

Network: Internet

Annotation

Целью настоящего проекта стала разработка сервиса для оценки удобочитаемости и воспринимаемости электронного текста как способ повышения качества новостного, образовательного и научного контента веб-сайта высшего учебного заведения. В статье рассмотрены подходы к оценке удобочитаемости, рассчитано соответствие классических метрик оценки сложности текста и экспертных оценок, предложен комбинированный подход к определению уровня удобочитаемости текста. Представлен алгоритм градиентного бустинга XGBoost как инструмент для реализации нейросетевого подхода к оценке удобочитаемости. Описаны этапы создания нейросетевой модели и полученные результаты.

The purpose of this work is to develop a tool for assessing the readability and perceptibility of electronic texts as a way to improve the quality of news, educational, and scientific content of a higher educational institution's website. The article considers approaches to the assessment of readability, the correspondence of classical metrics for assessing the text complexity and expert assessments calculated, the combined approach to determining the level of text readability proposed. The gradient boosting algorithm XGBoost is described as a tool for implementing a neural network approach to the readability evaluation. The stages of a neural network model development and the results obtained are outlined.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
-> Internet All Read Print Download

Table of Contents

  • 1
  • 24SAEC_2022_Часть_2
  • Step and repeat document 1 3

Usage statistics

stat Access count: 102
Last 30 days: 14
Detailed usage statistics