Details
Title | Разработка и исследование инструмента оценки схожести рукописи научной статьи и корпуса публикаций в конкретном научном журнале: выпускная квалификационная работа магистра: направление 09.04.01 «Информатика и вычислительная техника» ; образовательная программа 09.04.01_15 «Технологии проектирования системного и прикладного программного обеспечения» |
---|---|
Creators | Медведев Данил Владимирович |
Scientific adviser | Семенов Константин Константинович |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Imprint | Санкт-Петербург, 2024 |
Collection | Выпускные квалификационные работы; Общая коллекция |
Subjects | обработка естественного языка; искусственный интеллект; оценка сходства; инструмент помощи исследователю; публикационный процесс; natural language processing; artificial intelligence; similarity measure; researcher assistance tool; publication process |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 09.04.01 |
Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
DOI | 10.18720/SPBPU/3/2024/vr/vr24-3928 |
Rights | Доступ по паролю из сети Интернет (чтение) |
Additionally | New arrival |
Record key | ru\spstu\vkr\33147 |
Record create date | 8/29/2024 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Данная работа посвящена разработке инструмента для авторов рукописей, который предоставит интегральную количественную оценку схожести рукописи с корпусом научных статей, опубликованных в конкретном научном издании. В ходе исследования были решены следующие задачи: 1. Изучены особенности рецензионного процесса и выявлены его основные проблемы. 2. Исследованы особенности научных публикаций как одной из форм представления текстовых данных. 3. Проанализированы существующие наборы данных, содержащие научные публикации, и предложены методы для создания собственных датасетов. 4. Разработан инструмент оценки схожести рукописи научной статьи и корпуса публикаций в конкретном научном журнале. В результате был создан оценщик схожести рукописи с корпусом научных статей, который позволит авторам косвенно оценить шансы рассмотрения его работы и вероятность успешного прохождения рецензирования. Тестирование инструмента показало, что он хорошо справляется с оценкой схожести на наборе данных из уже опубликованных работ в конкретных изданиях.
The given work aims to develop a tool for authors of manuscripts that will provide an integrated quantitative assessment of the similarity between a manuscript and a corpus of scientific articles published by a specific scientific journal. The research set the following goals: 1. The specific features of the manuscript review process have been studied and its main drawbacks were identified. 2. The characteristics of scientific publications as a form of data presentation have been investigated. 3. Existing datasets consisting of scientific publications have been analyzed and methods for creating ones own datasets have been proposed. 4. A tool for evaluating the similarity between a manuscript of a scientific article and a corpus of publications in a specific scientific journal has been developed. As a result, we have developed a manuscript similarity assessment tool that will allow authors to indirectly estimate the likelihood of their work being accepted for publication and the chances of a successful peer review. The tool has been tested on a dataset of previously published papers from specific journals and has shown promising results in assessing similarity.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 0
Last 30 days: 0