Details
| Title | Использование каскадов моделей для резюмирования встреч // Промышленный искусственный интеллект (ПИИ'2025): Всероссийская научно-практическая конференция с международным участием 3–4 июля 2025 года: cборник научных трудов |
|---|---|
| Creators | Суин Алексей Евгеньевич ; Серебряков Владислав Олегович ; Чернышева Татьяна Юрьевна |
| Organization | Тюменский государственный университет |
| Imprint | Санкт-Петербург: ПОЛИТЕХ-ПРЕСС, 2025 |
| Collection | Общая коллекция |
| Document type | Article, report |
| Language | Russian |
| DOI | 10.18720/SPBPU/2/id25-548 |
| Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
| Additionally | New arrival |
| Record key | RU\SPSTU\edoc\77891 |
| Record create date | 12/25/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
| Group | Anonymous |
|---|---|
| Network | Internet |
В работе описывается система резюмирования встреч, которая работает с любыми аудио/видео источниками (включая записи с телефона), извлекает действия и задачи участников на русском и английском языках и интегрирует готовые LLM. Используются методы преобразования речи в текст (STT) и большие языковые модели (LLM) с применением промпт-инжиниринга для автоматизации суммаризации встреч. В качестве примеров приведены сравнения моделей STT (Speechmatics и Whisper) и различных подходов к промпт-инжинирингу (Zero-shot, Fewshot, Chain of Thought). Построена общая схема методики каскадной интеграции STT и LLM для извлечения и структурирования задач из аудиозаписей встреч. Описанная система позволит уменьшить нагрузку на секретарей, ускоряя процессы обсуждения и принятий решений. Решение особенно полезно для гибридных команд, нуждающихся в ясности после встреч без ограничений по платформе.
The paper describes a meeting summarization system that processes any audio/video sources (including phone recordings), extracts action items and tasks in Russian and English, and integrates ready-to-use LLMs. The methods employed include speech-to-text (STT) conversion and large language models (LLMs) with prompt engineering for automated meeting summarization. Examples include comparisons of STT models (Speechmatics and Whisper) and different prompt engineering approaches (Zero-shot, Few-shot, Chain of Thought). A general methodology for cascaded integration of STT and LLM is developed to extract and structure tasks from meeting recordings. The proposed system reduces the workload on secretaries by accelerating discussion and decision-making processes. This solution is particularly useful for hybrid teams requiring clarity after meetings without platform restrictions.
| Network | User group | Action |
|---|---|---|
| ILC SPbPU Local Network | All |
|
| Internet | Authorized users SPbPU |
|
| Internet | Anonymous |
|
Access count: 0
Last 30 days: 0