Table | Card | RUSMARC | |
Allowed Actions: –
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group: Anonymous Network: Internet |
Annotation
В работе выполнен анализ алгоритмов кластеризации и методов оценки их качества. Рассмотрены методы представления текстовых данных для алгоритмов машинного обучения и подходы понижения размерности. Приведен экспериментальный выбор наилучшего сжимающего кодировщика для текстового корпуса данных. Описан процесс разработки и исследования алгоритма адаптивной кластеризации основанный на модификации иерархической кластеризации. Выполнено экспериментальное сравнение алгоритмов с разрабатываемым по формальным оценкам качества.
The paper analyzes clustering algorithms and methods for evaluating their quality. Methods for representing text data for machine learning algorithms and approaches for reducing the dimension are considered. An experimental selection of the best compression encoder for a text data body is given. The process of developing and researching an adaptive clustering algorithm based on a modification of hierarchical clustering is described. An experimental comparison of the algorithms with those developed using formal quality estimates is performed.
Document access rights
Network | User group | Action | ||||
---|---|---|---|---|---|---|
ILC SPbPU Local Network | All | |||||
Internet | Authorized users SPbPU | |||||
Internet | Anonymous |
Usage statistics
Access count: 29
Last 30 days: 1 Detailed usage statistics |