Details

Title Разработка системы анализа вакансий: выпускная квалификационная работа магистра: направление 02.04.02 «Фундаментальная информатика и информационные технологии» ; образовательная программа 02.04.02_02 «Проектирование сложных информационных систем»
Creators Старовойтов Александр Евгеньевич
Scientific adviser Самочадин Александр Викторович
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint Санкт-Петербург, 2022
Collection Выпускные квалификационные работы; Общая коллекция
Subjects Информационные системы; распознавание именованных сущностей; обработка текстов на естественном языке; анализ вакансий; извлечение требований вакансий; named-entity recognition; natural language processing; job analysis; job requirements extraction
UDC 004.7
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 02.04.02
Speciality group (FGOS) 020000 - Компьютерные и информационные науки
DOI 10.18720/SPBPU/3/2023/vr/vr23-449
Rights Доступ по паролю из сети Интернет (чтение)
Record key ru\spstu\vkr\20717
Record create date 4/3/2023

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

Тема выпускной квалификационной работы «Разработка системы анализа вакансий». Данная работа посвящена разработке системы, которая позволит распознавать требования работодателей в неструктурированных текстах описания вакансий, а также анализировать вакансии на рынке труда для формирования списка наиболее требуемых навыков. В работе проанализированы существующие системы для распознавания навыков в текстах вакансий, а также подходы к решению данной задачи. Также описаны процесс сбора и разметки данных для обучения модели, используемой для распознавания требований, оценка ее работы и архитектура решения. Для решения задачи используются библиотеки Spacy, Numpy, Pandas, jsonpath_ng и язык программирования Python. Для обучения модели используется набор данных вакансий, сформированный и размеченный в ходе работы. Результаты работы: модель для распознавания требований вакансий; система, использующая эту модель для решения поставленных задач; созданный размеченный набор данных вакансий, подходящий для обучения аналогичных моделей. Точность распознавания навыков в тексте – 90%.

The subject of the graduate qualification work is “Job analysis system development”. The given work is devoted to the development of a system that allows to recognize requirements in unstructured job description texts and analyze a set of jobs in order to create a list of the most mentioned requirements. The paper analyzes existing systems and approaches for skill recognition in job description texts, describes the system architecture, the process of data collection and annotation for training the model used for skill recognition. Spacy, Numpy, Pandas and jsonpath_ng libraries and Python programming language were used for the system development. A dataset containing job descriptions was created and annotated for training the model. The results of work are a model for job requirements recognition, a system, which uses this model and an annotated dataset, which can be used for training similar models. The precision of job skill recognition is 90%.

Network User group Action
ILC SPbPU Local Network All
Read
Internet Authorized users SPbPU
Read
Internet Anonymous

Access count: 1 
Last 30 days: 0

Detailed usage statistics