Details
| Title | Методы интеллектуального анализа запросов в многопользовательских информационных системах: научный доклад: направление подготовки 09.06.01 «Информатика и вычислительная техника» ; направленность 09.06.01_06 «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей» |
|---|---|
| Creators | Юдаков Владимир Сергеевич |
| Scientific adviser | Воинов Никита Владимирович |
| Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
| Imprint | Санкт-Петербург, 2025 |
| Collection | Научные работы аспирантов/докторантов ; Общая коллекция |
| Subjects | Информационные системы ; Алгоритмы ; интеллектуальный анализ запросов ; sql-запросы ; коэффициент dice ; кластеризация ; частые паттерны ; intelligent query analysis ; sql queries ; dice coefficient ; clustering ; frequent patterns |
| UDC | 004.7 ; 004.421 |
| Document type | Scientific report |
| Language | Russian |
| Level of education | Graduate student |
| Speciality code (FGOS) | 09.06.01 |
| Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
| Rights | Текст не доступен в соответствии с распоряжением СПбПУ от 11.04.2018 № 141 |
| Record key | ru\spstu\vkr\39397 |
| Record create date | 10/17/2025 |
В данной работе предложен метод интеллектуального анализа SQL-запросов на основе коэффициента Dice и алгоритма DIC. Метод обеспечивает структурно-семантическую кластеризацию и выделение частых паттернов. Разработан программный комплекс на Python, протестированный на реальных логах. Эксперименты показали преимущество алгоритма Dice + DIC над традиционными методами (Apriori, FP-Growth) по точности, полноте, F1-мере, Silhouette, ARI, NMI и времени анализа.
This paper proposes a method for intelligent SQL query analysis based on the Dice coefficient and the DIC algorithm. The method enables structural-semantic clustering and the identification of frequent patterns. A Python-based software package was developed and tested on real logs. Experiments demonstrated the superiority of the Dice + DIC algorithm over traditional methods (Apriori, FP-Growth) in terms of precision, recall, F1-score, Silhouette, ARI, NMI, and analysis time.