Детальная информация
| Название | Использование каскадов моделей для резюмирования встреч // Промышленный искусственный интеллект (ПИИ'2025): Всероссийская научно-практическая конференция с международным участием 3–4 июля 2025 года: cборник научных трудов |
|---|---|
| Авторы | Суин Алексей Евгеньевич ; Серебряков Владислав Олегович ; Чернышева Татьяна Юрьевна |
| Организация | Тюменский государственный университет |
| Выходные сведения | Санкт-Петербург: ПОЛИТЕХ-ПРЕСС, 2025 |
| Коллекция | Общая коллекция |
| Тип документа | Статья, доклад |
| Язык | Русский |
| DOI | 10.18720/SPBPU/2/id25-548 |
| Права доступа | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
| Дополнительно | Новинка |
| Ключ записи | RU\SPSTU\edoc\77891 |
| Дата создания записи | 25.12.2025 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
| Группа | Анонимные пользователи |
|---|---|
| Сеть | Интернет |
В работе описывается система резюмирования встреч, которая работает с любыми аудио/видео источниками (включая записи с телефона), извлекает действия и задачи участников на русском и английском языках и интегрирует готовые LLM. Используются методы преобразования речи в текст (STT) и большие языковые модели (LLM) с применением промпт-инжиниринга для автоматизации суммаризации встреч. В качестве примеров приведены сравнения моделей STT (Speechmatics и Whisper) и различных подходов к промпт-инжинирингу (Zero-shot, Fewshot, Chain of Thought). Построена общая схема методики каскадной интеграции STT и LLM для извлечения и структурирования задач из аудиозаписей встреч. Описанная система позволит уменьшить нагрузку на секретарей, ускоряя процессы обсуждения и принятий решений. Решение особенно полезно для гибридных команд, нуждающихся в ясности после встреч без ограничений по платформе.
The paper describes a meeting summarization system that processes any audio/video sources (including phone recordings), extracts action items and tasks in Russian and English, and integrates ready-to-use LLMs. The methods employed include speech-to-text (STT) conversion and large language models (LLMs) with prompt engineering for automated meeting summarization. Examples include comparisons of STT models (Speechmatics and Whisper) and different prompt engineering approaches (Zero-shot, Few-shot, Chain of Thought). A general methodology for cascaded integration of STT and LLM is developed to extract and structure tasks from meeting recordings. The proposed system reduces the workload on secretaries by accelerating discussion and decision-making processes. This solution is particularly useful for hybrid teams requiring clarity after meetings without platform restrictions.
| Место доступа | Группа пользователей | Действие |
|---|---|---|
| Локальная сеть ИБК СПбПУ | Все |
|
| Интернет | Авторизованные пользователи СПбПУ |
|
| Интернет | Анонимные пользователи |
|
Количество обращений: 0
За последние 30 дней: 0