Детальная информация

Корелин, Василий Николаевич. Применение модифицированного алгоритма LSH для кластеризации внешнего окружения веб-пространства университетов [Электронный ресурс] = Clastering of the external web environment of universities using a modified LSD algorithm / В. Н. Корелин, И. С. Блеканов, С. Л. Сергеев. — Электрон. текстовые дан. (1 файл : 318 КБ) // Научно-технические ведомости Санкт-Петербургского государственного политехнического университета = St. Petersburg state polytechnical university journal. Computer science. Telecommunications and control systems. Сер.: Информатика. Телекоммуникации. Управление: научное издание. – Санкт-Петербург, 2015. – № 5 (229) [Электронный ресурс]. — Загл. с титул. экрана. — Электронная версия печатной публикации. — Свободный доступ из сети Интернет (чтение, печать, копирование). — Текстовый файл. — Adobe Acrobat Reader 7.0. — <URL:http://elib.spbstu.ru/dl/2/j16-60.pdf>. — <URL:http://doi.org/10.5862/JCSTCS.229.8>.

Дата создания записи: 31.03.2016

Тематика: Вычислительная техника; Манипулирование данными; Статистика; Теория статистики; кластерный анализ; вебометрика; вебометрические рейтинги; методы кластеризации; кластеризация внешних ресурсов; внешние ресурсы; веб-ресурсы; web-ресурсы; LSH алгоритм; Locality-Sensitive Hashing; кластеризация доменов; сайты вузов; рейтинги вузов

УДК: 004.62; 311

ББК: 32.973-018.2; 60.60

Коллекции: Общая коллекция

Ссылки: DOI

Разрешенные действия: Прочитать Загрузить (318 Кб) Для чтения документа необходим Flash Player

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Проведен кластерный анализ внешних ресурсов сайтов крупных университетов. В качестве исследуемых объектов выбраны сайты университетов России, США и Великобритании, занимающие в своих регионах ведущие позиции в вебометрическом рейтинге. Цель работы – в выявлении для каждого сайта университета групп внешних веб-ресурсов с одинаковым родом деятельности. Проведен анализ найденных групп: определена степень влияния количества и размеров этих групп на вебометрический рейтинг сайтов университетов. Разработан алгоритм кластеризации, основанный на вероятностном методе понижения размерности многомерных данных (Locality-Sensitive Hashing –LSH). Поставлен эксперимент, в котором на тестовых данных показано, что алгоритм позволяет с высокой скоростью и допустимой точностью проводить кластеризацию большого объема данных. Приведены основные результаты исследования.

The paper is dedicated to cluster analysis of external web sites of large universities (web sites that refer to universities and web sites that are referred by universities). Web sites in Russia, the USA and the UK that have highest webometric ranking in their region were chosen as the subject of the study. The goal of the research is to identify a group of sites for each university that have the same kind of activity. The found clusters have been analyzed to determine the impact of group size and the number of groups on webometric ranking of university sites. To achieve the goal of the research, the authors developed a clustering algorithm based on the probabilistic method of reducing the dimension of multidimensional data (Locality-Sensitive Hashing, or LSH). An experiment that was conducted using the test data showed that the developed algorithm has good clustering quality and fast speed performance during massive dataset mining. The main results of the research are presented.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
-> Интернет Все Прочитать Печать Загрузить

Статистика использования документа

stat Количество обращений: 352
За последние 30 дней: 4
Подробная статистика