Details

Title: Исследование методик семантического анализа текстов в задачах кластеризации текстовых сообщений: магистерская диссертация: 02.04.03
Creators: Баудин Илья Дмитриевич
Scientific adviser: Щукин Александр Валентинович
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2017
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: Вычислительные машины электронные персональные — Применение; естественный язык; компьютерная лингвистика; кластеризация; текстовые сообщения; семантический анализ
UDC: 004.912(043.3)
LBC: 81.1я031
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Speciality code (FGOS): 02.04.03
Speciality group (FGOS): 020000 - Компьютерные и информационные науки
DOI: 10.18720/SPBPU/2/v17-1901
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Кластеризация документов применяется уже достаточно долгое время, начиная с времен бурного роста электронно-вычислительных машин. Но сама по себе задача кластеризации относится к разделам data mining. В данной работе предлагается методика улучшения качества кластеризации текстовых сообщений на естественном языке, планируется увеличить точность и качество кластеризации путем учета семантической информации исходных текстов. Проводимое исследование включает в себя обзор имеющихся методов кластеризации текстовой информации, анализ методов извлечения именованных сущностей из текстов на естественном языке, разработку и реализацию методики кластеризации текстовых сообщений на русском языке с учетом семантической информации.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
Internet Authorized users (not from SPbPU)
-> Internet Anonymous

Usage statistics

stat Access count: 553
Last 30 days: 0
Detailed usage statistics