Details

Title Использование каскадов моделей для резюмирования встреч // Промышленный искусственный интеллект (ПИИ'2025): Всероссийская научно-практическая конференция с международным участием 3–4 июля 2025 года: cборник научных трудов
Creators Суин Алексей Евгеньевич ; Серебряков Владислав Олегович ; Чернышева Татьяна Юрьевна
Organization Тюменский государственный университет
Imprint Санкт-Петербург: ПОЛИТЕХ-ПРЕСС, 2025
Collection Общая коллекция
Document type Article, report
Language Russian
DOI 10.18720/SPBPU/2/id25-548
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key RU\SPSTU\edoc\77891
Record create date 12/25/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

В работе описывается система резюмирования встреч, которая работает с любыми аудио/видео источниками (включая записи с телефона), извлекает действия и задачи участников на русском и английском языках и интегрирует готовые LLM. Используются методы преобразования речи в текст (STT) и большие языковые модели (LLM) с применением промпт-инжиниринга для автоматизации суммаризации встреч. В качестве примеров приведены сравнения моделей STT (Speechmatics и Whisper) и различных подходов к промпт-инжинирингу (Zero-shot, Fewshot, Chain of Thought). Построена общая схема методики каскадной интеграции STT и LLM для извлечения и структурирования задач из аудиозаписей встреч. Описанная система позволит уменьшить нагрузку на секретарей, ускоряя процессы обсуждения и принятий решений. Решение особенно полезно для гибридных команд, нуждающихся в ясности после встреч без ограничений по платформе.

The paper describes a meeting summarization system that processes any audio/video sources (including phone recordings), extracts action items and tasks in Russian and English, and integrates ready-to-use LLMs. The methods employed include speech-to-text (STT) conversion and large language models (LLMs) with prompt engineering for automated meeting summarization. Examples include comparisons of STT models (Speechmatics and Whisper) and different prompt engineering approaches (Zero-shot, Few-shot, Chain of Thought). A general methodology for cascaded integration of STT and LLM is developed to extract and structure tasks from meeting recordings. The proposed system reduces the workload on secretaries by accelerating discussion and decision-making processes. This solution is particularly useful for hybrid teams requiring clarity after meetings without platform restrictions.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics