Details

Title Методы интеллектуального анализа запросов в многопользовательских информационных системах: научный доклад: направление подготовки 09.06.01 «Информатика и вычислительная техника» ; направленность 09.06.01_06 «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей»
Creators Юдаков Владимир Сергеевич
Scientific adviser Воинов Никита Владимирович
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2025
Collection Научные работы аспирантов/докторантов ; Общая коллекция
Subjects Информационные системы ; Алгоритмы ; интеллектуальный анализ запросов ; sql-запросы ; коэффициент dice ; кластеризация ; частые паттерны ; intelligent query analysis ; sql queries ; dice coefficient ; clustering ; frequent patterns
UDC 004.7 ; 004.421
Document type Scientific report
Language Russian
Level of education Graduate student
Speciality code (FGOS) 09.06.01
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
Rights Текст не доступен в соответствии с распоряжением СПбПУ от 11.04.2018 № 141
Record key ru\spstu\vkr\39397
Record create date 10/17/2025

В данной работе предложен метод интеллектуального анализа SQL-запросов на основе коэффициента Dice и алгоритма DIC. Метод обеспечивает структурно-семантическую кластеризацию и выделение частых паттернов. Разработан программный комплекс на Python, протестированный на реальных логах. Эксперименты показали преимущество алгоритма Dice + DIC над традиционными методами (Apriori, FP-Growth) по точности, полноте, F1-мере, Silhouette, ARI, NMI и времени анализа.

This paper proposes a method for intelligent SQL query analysis based on the Dice coefficient and the DIC algorithm. The method enables structural-semantic clustering and the identification of frequent patterns. A Python-based software package was developed and tested on real logs. Experiments demonstrated the superiority of the Dice + DIC algorithm over traditional methods (Apriori, FP-Growth) in terms of precision, recall, F1-score, Silhouette, ARI, NMI, and analysis time.