Таблица | Карточка | RUSMARC | |
Разрешенные действия: –
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа: Анонимные пользователи Сеть: Интернет |
Аннотация
В работе выполнен анализ алгоритмов кластеризации и методов оценки их качества. Рассмотрены методы представления текстовых данных для алгоритмов машинного обучения и подходы понижения размерности. Приведен экспериментальный выбор наилучшего сжимающего кодировщика для текстового корпуса данных. Описан процесс разработки и исследования алгоритма адаптивной кластеризации основанный на модификации иерархической кластеризации. Выполнено экспериментальное сравнение алгоритмов с разрабатываемым по формальным оценкам качества.
The paper analyzes clustering algorithms and methods for evaluating their quality. Methods for representing text data for machine learning algorithms and approaches for reducing the dimension are considered. An experimental selection of the best compression encoder for a text data body is given. The process of developing and researching an adaptive clustering algorithm based on a modification of hierarchical clustering is described. An experimental comparison of the algorithms with those developed using formal quality estimates is performed.
Права на использование объекта хранения
Место доступа | Группа пользователей | Действие | ||||
---|---|---|---|---|---|---|
Локальная сеть ИБК СПбПУ | Все | |||||
Интернет | Авторизованные пользователи СПбПУ | |||||
Интернет | Анонимные пользователи |
Статистика использования
Количество обращений: 29
За последние 30 дней: 1 Подробная статистика |