Детальная информация

Название: Автоматическая классификация текстов машинным обучением: применение в области идентификации личностных черт: выпускная квалификационная работа магистра: направление 09.04.01 «Информатика и вычислительная техника» ; образовательная программа 09.04.01_15 «Технологии проектирования системного и прикладного программного обеспечения»
Авторы: Мбеле Оссийи Люк Прюсель
Научный руководитель: Богач Наталья Владимировна
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2022
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: Искусственный интеллект; черты личности; французский язык; предварительная обработка данных; аннотация данных; алгоритмы бустинга; полнота; точность; вектор представления данных; personality traits; french; data preprocessing; data annotation; boosting algorithms; recall; accuracy; data representation vector
УДК: 004.8
Тип документа: Выпускная квалификационная работа магистра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Магистратура
Код специальности ФГОС: 09.04.01
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2022/vr/vr22-2030
Права доступа: Доступ по паролю из сети Интернет (чтение)
Ключ записи: ru\spstu\vkr\17292

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

С появлением социальных сетей в мире было множество изменений. Через социальные сети несколько человек могут оставаться на связи (хотя и географически удаленными) с родственниками, знакомыми, быть в курсе о сегодняшних новостях, участвовать в дискуссиях и даже выражать свои взгляды, эмоции, чувства по различным темам, что может предсказать нам о поведении или, по крайней мере, личности человека. Кроме того, в нескольких сферах, включая бизнес, профессиональную деятельность (политика в области найма), в которых активность человека в интернете рассматривается как важнейшая, знание личностных черт человека может оказаться прибыльным и чрезвычайно важным. Таким образом, разработка моделей идентификации личностных качеств становится актуальной задачей. Цели данной работы состоят в том, чтобы создать с нуля небольшой набор данных и классифицировать личностные черты пользователя по текстам (на французском языке) применяя контролируемые методы машинного обучения и на основе психологической модели DISC. Хотя созданный набор данных был относительно среднего размера и несбалансированным, разработанная модель показала обнадеживающие и убедительные результаты после применения гипернастройка параметров и методов повторной выборки.

With the advent of social networks, there have been many changes in the world. Through social networks, several people can stay in touch (albeit geographically remote) with relatives, acquaintances, be aware of today's news, participate in discussions and even express their views, emotions, feelings on various topics, which can predict us about a person's behavior or, at least, personality. In addition, in several areas, including business, professional activity (recruitment policy), in which a person's online activity is considered as the most important, knowledge of a person's personality traits can be profitable and extremely important. Thus, the development of models of identification of personal traits becomes a relevant task. The goals of this work are to create a small dataset from scratch and classify the user's personality traits by texts (in French) using supervised machine learning methods and based on the DISC psychological model. Although the created dataset was relatively medium-sized and unbalanced, the developed model showed encouraging and convincing results after applying hyper-tuning parameters and resampling methods.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать
Интернет Авторизованные пользователи СПбПУ Прочитать
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 6
За последние 30 дней: 0
Подробная статистика