Details

Title: Распознавание естественных языков на предмет их принадлежности одной языковой группе: выпускная квалификационная работа бакалавра: 09.03.01 - Информатика и вычислительная техника ; 09.03.01_08 - Встраиваемые системы управления
Creators: Чурляев Дмитрий Олегович
Scientific adviser: Никитин Кирилл Вячеславович
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2018
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: дистрибутивная семантика; word2vec; реккурентные нейронные сети; lstm
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Level of education: Bachelor
Speciality code (FGOS): 09.03.01
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
Links: Отзыв руководителя; Рецензия
DOI: 10.18720/SPBPU/2/v18-5031
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: RU\SPSTU\edoc\57379

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

В данной работе проведен обзор некоторых разновидностей рекуррентных нейронных сетей. Рассмотрен раздел лингвистики под названием дистрибутивная семантика, а также описана реализация системы для получения семантических характеристик слов, на основе дистрибутивной гипотезы – Word2Vec. На основании выше перечисленных технологий создан классификатор языковых групп, а также приведены полученные результаты близости изолированных языков к приведенным языковым группам.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Table of Contents

  • ВВЕДЕНИЕ
  • 1. Дистрибутивная семантика
    • 1.1. Математическая модель
    • 1.2. Традиционная счётная модель
    • 1.3. Предсказательная модель, Word2Vec
      • 1.3.1. Skip-gram
      • 1.3.2. Continuous bag of words
  • 2. Рекуррентные нейронные сети
    • 2.1. Архитектуры РНС
    • 2.2. Обучение
    • 2.3. Сети долгой краткосрочной памяти
  • 3. Разработка предсказательной системы
    • 3.1. Параметры сети
    • 3.2. Обучение и тестирование
  • 4. Реализация классификатора
    • 4.1. Параметры сети
    • 4.2. Обучение и тестирование
  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
  • ПРИЛОЖЕНИЕ 1. ЛИСТИНГ

Usage statistics

stat Access count: 134
Last 30 days: 0
Detailed usage statistics