Details
| Title | Разработка и внедрение интеллектуальной системы рекомендаций и диалогового агента: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_03 «Машинное обучение в управлении бизнесом» = Development and implementation of an intelligent recommendation system and dialogue agent |
|---|---|
| Creators | Третьяков Егор Сергеевич |
| Scientific adviser | Гейда Александр Сергеевич |
| Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт промышленного менеджмента, экономики и торговли |
| Imprint | Санкт-Петербург, 2025 |
| Collection | Выпускные квалификационные работы ; Общая коллекция |
| Subjects | интеллектуальный ассистент ; языковая модель ; автоматическое распознавание речи ; семантический поиск ; рекомендательная система ; telegram-бот ; база знаний ; креативные индустрии ; intelligent assistant ; language model ; automatic speech recognition ; semantic search ; recommender system ; telegram bot ; knowledge base ; creative industries |
| Document type | Master graduation qualification work |
| Language | Russian |
| Level of education | Master |
| Speciality code (FGOS) | 09.04.04 |
| Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
| DOI | 10.18720/SPBPU/3/2025/vr/vr26-1214 |
| Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
| Additionally | New arrival |
| Record key | ru\spstu\vkr\40886 |
| Record create date | 7/1/2026 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
| Group | Anonymous |
|---|---|
| Network | Internet |
Цель исследования — спроектировать и реализовать прототип, который сокращает время обработки внутренних встреч, обеспечивает мгновенный доступ к накопленным знаниям компании и помогает подбирать нестандартные визуальные и геймдизайнерские референсы. Предмет ВКР — программная архитектура, объединяющая локальные модели автоматического распознавания речи и языкового понимания с векторной базой данных и гибридным рекомендателем. Методы исследования включают архитектурное моделирование, применение открытых нейросетевых моделей Whisper и Mistral-7B, формирование векторного индекса ChromaDB, расчёт косинусного сходства, item-based коллаборативную фильтрацию и сравнительный анализ различных схем развёртывания. В ходе работы создана модульная интеллектуальная система, которая выполняет транскрипцию аудио, суммаризацию, семантический поиск и формирование рекомендаций. Все компоненты сведены в единую платформу, пригодную как для локальной установки, так и для облачной среды. В качестве пользовательского интерфейса выбран Telegram-бот, органично вписывающийся в повседневные процессы студии. Испытания на реальных данных подтвердили стабильность системы; предварительная оценка экономической эффективности показала потенциал снижения трудозатрат и улучшения внутренних коммуникаций. Полученные результаты демонстрируют высокую прикладную ценность решения и перспективы его масштабирования в креативной индустрии. Область применения результатов ВКР — малые и средние креативные команды: дизайн-студии, инди-геймдев, продакшн-агентства, где важно ускорить документы-оборот, сделать знания легко доступными и автоматизировать поиск референсов. Научная новизна работы состоит в интеграции локальных моделей ASR и LLM с RAG-поиском и гибридным рекомендателем внутри лёгкой Telegram-оболочки при сохранении полного контроля над приватными данными. Такое сочетание ранее не описывалось для команд креативной отрасли и может быть тиражировано в других производственных контекстах. Выводы. Все поставленные задачи выполнены, цель достигнута. Созданный прототип демонстрирует практическую эффективность в будущем: время подготовки конспектов встреч сократилось в десять раз, поиск нужных знаний ускорился, а подбор референсов стал точнее и разнообразнее. Модульная архитектура обеспечивает гибкость дальнейшего развития: систему можно масштабировать, подключая более мощные модели, расширяя базу данных и интегрируясь с внешними сервисами управления проектами.
The purpose of the research is to build a prototype that reduces the time required for processing internal meetings, ensures fast access to corporate knowledge, and assists in finding unconventional visual and game design references. The subject of the thesis is the software architecture that integrates local models for speech recognition and natural language understanding with a vector knowledge base and a hybrid recommender system. The research methods include architectural modeling, the use of open-source neural network models such as Whisper and Mistral-7B, the creation of a vector index using ChromaDB, cosine similarity computation, item-based collaborative filtering, and comparative analysis of different deployment strategies. During the course of the work, a modular intelligent system was developed, combining audio transcription, summarization, semantic search, and a recommendation mechanism. All modules were integrated into a unified platform capable of functioning both in local and cloud environments. Its implementation as a Telegram bot provided a convenient and intuitive interface suited for daily team workflows. Testing confirmed the stability and functionality of all components using real data. Additionally, a preliminary assessment of economic efficiency demonstrated the system’s potential for reducing manual workload and improving internal communications. The results highlight the practical value of the solution and its scalability within the creative industry. The results of this thesis are applicable to small and medium-sized creative teams—such as design studios, indie game developers, and production agencies—where accelerating document workflows, increasing access to institutional knowledge, and automating reference search are critical. The scientific novelty of the work lies in integrating local ASR and LLM models with RAG-based search and a hybrid recommender system within a lightweight Telegram interface while maintaining full control over private data. This approach has not previously been described for creative teams and may be adapted to other production contexts. Conclusions. All stated objectives have been met, and the overall goal of the project has been achieved. The resulting prototype demonstrates real-world utility: the time required to prepare meeting notes was reduced tenfold, knowledge search became faster, and reference selection became more accurate and diverse. The modular architecture ensures flexibility for future development: the system can be scaled by connecting more powerful models, expanding the database, and integrating with external project management services.
| Network | User group | Action |
|---|---|---|
| ILC SPbPU Local Network | All |
|
| Internet | Authorized users SPbPU |
|
| Internet | Anonymous |
|