Details

Title: Распознавание естественных языков на предмет их принадлежности одной языковой группе: выпускная квалификационная работа бакалавра: 09.03.01 - Информатика и вычислительная техника ; 09.03.01_08 - Встраиваемые системы управления
Creators: Чурляев Дмитрий Олегович
Scientific adviser: Никитин Кирилл Вячеславович
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2018
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: дистрибутивная семантика; word2vec; реккурентные нейронные сети; lstm
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Speciality code (FGOS): 09.03.01
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
Links: Отзыв руководителя; Рецензия
DOI: 10.18720/SPBPU/2/v18-5031
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

В данной работе проведен обзор некоторых разновидностей рекуррентных нейронных сетей. Рассмотрен раздел лингвистики под названием дистрибутивная семантика, а также описана реализация системы для получения семантических характеристик слов, на основе дистрибутивной гипотезы – Word2Vec. На основании выше перечисленных технологий создан классификатор языковых групп, а также приведены полученные результаты близости изолированных языков к приведенным языковым группам.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
Internet Authorized users (not from SPbPU)
-> Internet Anonymous

Table of Contents

  • ВВЕДЕНИЕ
  • 1. Дистрибутивная семантика
    • 1.1. Математическая модель
    • 1.2. Традиционная счётная модель
    • 1.3. Предсказательная модель, Word2Vec
      • 1.3.1. Skip-gram
      • 1.3.2. Continuous bag of words
  • 2. Рекуррентные нейронные сети
    • 2.1. Архитектуры РНС
    • 2.2. Обучение
    • 2.3. Сети долгой краткосрочной памяти
  • 3. Разработка предсказательной системы
    • 3.1. Параметры сети
    • 3.2. Обучение и тестирование
  • 4. Реализация классификатора
    • 4.1. Параметры сети
    • 4.2. Обучение и тестирование
  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
  • ПРИЛОЖЕНИЕ 1. ЛИСТИНГ

Usage statistics

stat Access count: 71
Last 30 days: 1
Detailed usage statistics