Details

Баудин, Илья Дмитриевич. Исследование методик семантического анализа текстов в задачах кластеризации текстовых сообщений [Электронный ресурс]: магистерская диссертация: 02.04.03 / И. Д. Баудин; Санкт-Петербургский политехнический университет Петра Великого, Институт компьютерных наук и технологий ; науч. рук. А. В. Щукин. — Электрон. текстовые дан. (1 файл : 1,12 МБ). — Санкт-Петербург, 2017. — Загл. с титул. экрана. — Свободный доступ из сети Интернет (чтение, печать, копирование). — Adobe Acrobat Reader 7.0. — <URL:http://elib.spbstu.ru/dl/2/v17-1901.pdf>. — <URL:http://doi.org/10.18720/SPBPU/2/v17-1901>.

Record create date: 7/6/2017

Subject: Вычислительные машины электронные персональные — Применение; естественный язык; компьютерная лингвистика; кластеризация; текстовые сообщения; семантический анализ

UDC: 004.912(043.3)

LBC: 81.1я031

Collections: Выпускные квалификационные работы; Общая коллекция

Links: DOI

Allowed Actions: Read Download (1.1 Mb) You need Flash Player to read document

Group: Anonymous

Network: Internet

Annotation

Кластеризация документов применяется уже достаточно долгое время, начиная с времен бурного роста электронно-вычислительных машин. Но сама по себе задача кластеризации относится к разделам data mining. В данной работе предлагается методика улучшения качества кластеризации текстовых сообщений на естественном языке, планируется увеличить точность и качество кластеризации путем учета семантической информации исходных текстов. Проводимое исследование включает в себя обзор имеющихся методов кластеризации текстовой информации, анализ методов извлечения именованных сущностей из текстов на естественном языке, разработку и реализацию методики кластеризации текстовых сообщений на русском языке с учетом семантической информации.

Document access rights

Network User group Action
FL SPbPU Local Network All Read Print Download
-> Internet All Read Print Download

Document usage statistics

stat Document access count: 2050
Last 30 days: 71
Detailed usage statistics