Использование каскадов моделей для резюмирования встреч

Суин, Алексей Евгеньевич; Серебряков, Владислав Олегович; Чернышева, Татьяна Юрьевна

Details

Title	Использование каскадов моделей для резюмирования встреч // Промышленный искусственный интеллект (ПИИ'2025): Всероссийская научно-практическая конференция с международным участием 3–4 июля 2025 года: cборник научных трудов
Creators	Суин Алексей Евгеньевич ; Серебряков Владислав Олегович ; Чернышева Татьяна Юрьевна
Organization	Тюменский государственный университет
Imprint	Санкт-Петербург: ПОЛИТЕХ-ПРЕСС, 2025
Collection	Общая коллекция
Document type	Article, report
Language	Russian
DOI	10.18720/SPBPU/2/id25-548
Rights	Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally	New arrival
Record key	RU\SPSTU\edoc\77891
Record create date	12/25/2025

Allowed Actions

–

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group	Anonymous
Network	Internet

В работе описывается система резюмирования встреч, которая работает с любыми аудио/видео источниками (включая записи с телефона), извлекает действия и задачи участников на русском и английском языках и интегрирует готовые LLM. Используются методы преобразования речи в текст (STT) и большие языковые модели (LLM) с применением промпт-инжиниринга для автоматизации суммаризации встреч. В качестве примеров приведены сравнения моделей STT (Speechmatics и Whisper) и различных подходов к промпт-инжинирингу (Zero-shot, Fewshot, Chain of Thought). Построена общая схема методики каскадной интеграции STT и LLM для извлечения и структурирования задач из аудиозаписей встреч. Описанная система позволит уменьшить нагрузку на секретарей, ускоряя процессы обсуждения и принятий решений. Решение особенно полезно для гибридных команд, нуждающихся в ясности после встреч без ограничений по платформе.

The paper describes a meeting summarization system that processes any audio/video sources (including phone recordings), extracts action items and tasks in Russian and English, and integrates ready-to-use LLMs. The methods employed include speech-to-text (STT) conversion and large language models (LLMs) with prompt engineering for automated meeting summarization. Examples include comparisons of STT models (Speechmatics and Whisper) and different prompt engineering approaches (Zero-shot, Few-shot, Chain of Thought). A general methodology for cascaded integration of STT and LLM is developed to extract and structure tasks from meeting recordings. The proposed system reduces the workload on secretaries by accelerating discussion and decision-making processes. This solution is particularly useful for hybrid teams requiring clarity after meetings without platform restrictions.

Network	User group	Action
ILC SPbPU Local Network	All
Internet	Authorized users SPbPU
Internet	Anonymous

"Промышленный искусственный интеллект (ПИИ'2025)", всероссийская научно-практическая конференция (2025; Санкт-Петербург). Промышленный искусственный интеллект (ПИИ'2025): Всероссийская научно-практическая конференция с международным участием 3–4 июля 2025 года: cборник научных трудов / Российская академия наук, Санкт-Петербургское отделение, Санкт-Петербургский политехнический университет Петра Великого, Санкт-Петербургский государственный университет; под общей редакцией Д. Г. Арсеньева. — Санкт-Петербург: ПОЛИТЕХ-ПРЕСС, 2025. — 1 файл (197 Мб Мб). — Загл. с титул. экрана. — Ч. текста парал. на рус. и англ. яз. — Электронная копия печатной публикации 2025 г. — Доступ по паролю из сети Интернет (чтение, печать, копирование). — <URL:http://elib.spbstu.ru/dl/2/i25-310.pdf>. — DOI 10.18720/SPBPU/2/i25-310. — Текст: электронный

Access count: 0
Last 30 days: 0

Detailed usage statistics