Детальная информация

Название: Распознавание естественных языков на предмет их принадлежности одной языковой группе: выпускная квалификационная работа бакалавра: 09.03.01 - Информатика и вычислительная техника ; 09.03.01_08 - Встраиваемые системы управления
Авторы: Чурляев Дмитрий Олегович
Научный руководитель: Никитин Кирилл Вячеславович
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2018
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: дистрибутивная семантика; word2vec; реккурентные нейронные сети; lstm
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Бакалавриат
Код специальности ФГОС: 09.03.01
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
Ссылки: Отзыв руководителя; Рецензия
DOI: 10.18720/SPBPU/2/v18-5031
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: RU\SPSTU\edoc\57379

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

В данной работе проведен обзор некоторых разновидностей рекуррентных нейронных сетей. Рассмотрен раздел лингвистики под названием дистрибутивная семантика, а также описана реализация системы для получения семантических характеристик слов, на основе дистрибутивной гипотезы – Word2Vec. На основании выше перечисленных технологий создан классификатор языковых групп, а также приведены полученные результаты близости изолированных языков к приведенным языковым группам.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Оглавление

  • ВВЕДЕНИЕ
  • 1. Дистрибутивная семантика
    • 1.1. Математическая модель
    • 1.2. Традиционная счётная модель
    • 1.3. Предсказательная модель, Word2Vec
      • 1.3.1. Skip-gram
      • 1.3.2. Continuous bag of words
  • 2. Рекуррентные нейронные сети
    • 2.1. Архитектуры РНС
    • 2.2. Обучение
    • 2.3. Сети долгой краткосрочной памяти
  • 3. Разработка предсказательной системы
    • 3.1. Параметры сети
    • 3.2. Обучение и тестирование
  • 4. Реализация классификатора
    • 4.1. Параметры сети
    • 4.2. Обучение и тестирование
  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
  • ПРИЛОЖЕНИЕ 1. ЛИСТИНГ

Статистика использования

stat Количество обращений: 134
За последние 30 дней: 0
Подробная статистика