Детальная информация

Название Методы интеллектуального анализа запросов в многопользовательских информационных системах: научный доклад: направление подготовки 09.06.01 «Информатика и вычислительная техника» ; направленность 09.06.01_06 «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей»
Авторы Юдаков Владимир Сергеевич
Научный руководитель Воинов Никита Владимирович
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения Санкт-Петербург, 2025
Коллекция Научные работы аспирантов/докторантов ; Общая коллекция
Тематика Информационные системы ; Алгоритмы ; интеллектуальный анализ запросов ; sql-запросы ; коэффициент dice ; кластеризация ; частые паттерны ; intelligent query analysis ; sql queries ; dice coefficient ; clustering ; frequent patterns
УДК 004.7 ; 004.421
Тип документа Научный доклад
Язык Русский
Уровень высшего образования Аспирантура
Код специальности ФГОС 09.06.01
Группа специальностей ФГОС 090000 - Информатика и вычислительная техника
Права доступа Текст не доступен в соответствии с распоряжением СПбПУ от 11.04.2018 № 141
Ключ записи ru\spstu\vkr\39397
Дата создания записи 17.10.2025

В данной работе предложен метод интеллектуального анализа SQL-запросов на основе коэффициента Dice и алгоритма DIC. Метод обеспечивает структурно-семантическую кластеризацию и выделение частых паттернов. Разработан программный комплекс на Python, протестированный на реальных логах. Эксперименты показали преимущество алгоритма Dice + DIC над традиционными методами (Apriori, FP-Growth) по точности, полноте, F1-мере, Silhouette, ARI, NMI и времени анализа.

This paper proposes a method for intelligent SQL query analysis based on the Dice coefficient and the DIC algorithm. The method enables structural-semantic clustering and the identification of frequent patterns. A Python-based software package was developed and tested on real logs. Experiments demonstrated the superiority of the Dice + DIC algorithm over traditional methods (Apriori, FP-Growth) in terms of precision, recall, F1-score, Silhouette, ARI, NMI, and analysis time.