Details
Title | Разработка системы анализа вакансий: выпускная квалификационная работа магистра: направление 02.04.02 «Фундаментальная информатика и информационные технологии» ; образовательная программа 02.04.02_02 «Проектирование сложных информационных систем» |
---|---|
Creators | Старовойтов Александр Евгеньевич |
Scientific adviser | Самочадин Александр Викторович |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий |
Imprint | Санкт-Петербург, 2022 |
Collection | Выпускные квалификационные работы; Общая коллекция |
Subjects | Информационные системы; распознавание именованных сущностей; обработка текстов на естественном языке; анализ вакансий; извлечение требований вакансий; named-entity recognition; natural language processing; job analysis; job requirements extraction |
UDC | 004.7 |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 02.04.02 |
Speciality group (FGOS) | 020000 - Компьютерные и информационные науки |
DOI | 10.18720/SPBPU/3/2023/vr/vr23-449 |
Rights | Доступ по паролю из сети Интернет (чтение) |
Record key | ru\spstu\vkr\20717 |
Record create date | 4/3/2023 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Тема выпускной квалификационной работы «Разработка системы анализа вакансий». Данная работа посвящена разработке системы, которая позволит распознавать требования работодателей в неструктурированных текстах описания вакансий, а также анализировать вакансии на рынке труда для формирования списка наиболее требуемых навыков. В работе проанализированы существующие системы для распознавания навыков в текстах вакансий, а также подходы к решению данной задачи. Также описаны процесс сбора и разметки данных для обучения модели, используемой для распознавания требований, оценка ее работы и архитектура решения. Для решения задачи используются библиотеки Spacy, Numpy, Pandas, jsonpath_ng и язык программирования Python. Для обучения модели используется набор данных вакансий, сформированный и размеченный в ходе работы. Результаты работы: модель для распознавания требований вакансий; система, использующая эту модель для решения поставленных задач; созданный размеченный набор данных вакансий, подходящий для обучения аналогичных моделей. Точность распознавания навыков в тексте – 90%.
The subject of the graduate qualification work is “Job analysis system development”. The given work is devoted to the development of a system that allows to recognize requirements in unstructured job description texts and analyze a set of jobs in order to create a list of the most mentioned requirements. The paper analyzes existing systems and approaches for skill recognition in job description texts, describes the system architecture, the process of data collection and annotation for training the model used for skill recognition. Spacy, Numpy, Pandas and jsonpath_ng libraries and Python programming language were used for the system development. A dataset containing job descriptions was created and annotated for training the model. The results of work are a model for job requirements recognition, a system, which uses this model and an annotated dataset, which can be used for training similar models. The precision of job skill recognition is 90%.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 1
Last 30 days: 0