Детальная информация

Носов, Павел Владимирович. Метод автоматического определения уязвимостей в текстовых данных на основе Word2Vec [Электронный ресурс]: бакалаврская работа: 09.03.04 / П. В. Носов; Санкт-Петербургский политехнический университет Петра Великого, Институт компьютерных наук и технологий ; науч. рук. И. В. Никифоров. — Электрон. текстовые дан. (1 файл : 0,51 МБ). — Санкт-Петербург, 2017. — Загл. с титул. экрана. — Свободный доступ из сети Интернет (чтение, печать, копирование). — Adobe Acrobat Reader 7.0. — <URL:http://elib.spbstu.ru/dl/2/v17-3722.pdf>. — <URL:http://doi.org/10.18720/SPBPU/2/v17-3722>.

Дата создания записи: 27.09.2017

Тематика: автоматическое определение уязвимостей; векторное представление слов; семантическое соответствие текста

Коллекции: Выпускные квалификационные работы; Общая коллекция

Ссылки: DOI

Разрешенные действия: Прочитать Загрузить (0,7 Мб) Для чтения документа необходим Flash Player

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Данная работа на соискание степени бакалавра посвящена исследованию области автоматического определения уязвимостей в текстовых данных. В работе дан обзор систем автоматического определения уязвимостей. Был предложен метод определения семантического соответствия текста его заголовку. Метод был реализован на языке Java. Реализованный метод был аппробирован на демонстрационных примерах. Предоставлены результаты тестирования.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
-> Интернет Все Прочитать Печать Загрузить

Оглавление

  • Список рисунков
  • Список таблиц
  • Введение
  • Глава 1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ
    • 1.1 Обзор статистических методов и методов машинного обучения
      • 1.1.1 Методы определения выбросов
      • 1.1.2 Методы машинного обучения без учителя
      • 1.1.3 Методы машинного обучения с учителем
    • 1.2 Обзор инструментов векторного представления слов
      • 1.2.1. Обзор Word2Vec
    • 1.3 Обзор систем автоматического определения уязвимостей
    • 1.4 Выводы
  • Глава 2. МЕТОД ОПРЕДЕЛЕНИЯ СООТВЕТСТВИЯ ЗАГОЛОВКА ТЕКСТА ЕГО СОДЕРЖАНИЮ НА ОСНОВЕ WORD2VEC
    • 2.1 Обоснование необходимости метода
    • 2.2 Описание метода
    • 2.3 Алгоритм
      • 2.3.1 Схема алгоритма
      • 2.3.2 Нормализация входного текста
      • 2.3.3 Применение модели Word2Vec
      • 2.3.4 Получение векторов предложений
      • 2.3.5 Подсчёт расстояний между векторами
    • 2.4 Проверка гипотезы о соответствии заголовка тексту
    • 2.5 Выводы
  • Глава 3. РЕАЛИЗАЦИЯ МЕТОДА ОПРЕДЕЛЕНИЯ СООТВЕТСТВИЯ ЗАГОЛОВКА ТЕКСТА ЕГО СОДЕРЖАНИЮ НА ОСНОВЕ WORD2VEC
    • 3.1 Структура класса
      • 3.1.1 Поля класса
      • 3.1.2 Конструкторы класса
    • 3.2 Нормализация текста
      • 3.2.1 Метод rusvecForm
      • 3.2.2 Метод engvecForm
    • 3.3 Метод detect
    • 3.4 Выводы
  • Глава 4. РЕЗУЛЬТАТЫ
    • 4.1 Примеры работы реализованной системы
    • 4.2 Тестирование реализованной системы
    • 4.3 Выводы
    • Заключение

Статистика использования документа

stat Количество обращений: 681
За последние 30 дней: 22
Подробная статистика