Детальная информация

Название Система сравнения мультимодальных языковых моделей: выпускная квалификационная работа бакалавра: направление 01.03.02 «Прикладная математика и информатика» ; образовательная программа 01.03.02_04 «Биоинформатика»
Авторы Мартынов Александр Дмитриевич
Научный руководитель Чуканов Вячеслав Сергеевич
Организация Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт
Выходные сведения Санкт-Петербург, 2025
Коллекция Выпускные квалификационные работы ; Общая коллекция
Тематика машинное обучение ; языковые модели ; статистика ; machine learning ; language models ; statistics
Тип документа Выпускная квалификационная работа бакалавра
Тип файла PDF
Язык Русский
Уровень высшего образования Бакалавриат
Код специальности ФГОС 01.03.02
Группа специальностей ФГОС 010000 - Математика и механика
DOI 10.18720/SPBPU/3/2025/vr/vr25-3154
Права доступа Доступ по паролю из сети Интернет (чтение)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\37043
Дата создания записи 28.08.2025

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Данная работа посвящена разработке метода ранжирования мультимодальных языковых моделей (Multimodal Language Models, MLLM) с целью повышения точности и объективности их сравнения. Актуальность темы обусловлена возросшим количеством подобных моделей и популяризацией их применения в самых различных областях, что усложняет процесс выбора наилучшего алгоритма в каждом приложении, а также недостатком универсальной системы оценки их качества. В основе метода лежит анализ метрик качества, которые получают модели на валидационном наборе данных, а также их статистических свойств. Разрабатываемая процедура представляет собой улучшенную версию метода PROMETHEE, что позволяет точнее ранжировать модели с учетом противоречивых критериев качества и учитывает специфику работы с моделями машинного обучения. В ходе экспериментальной оценки показанопреимущество такого подхода по сравнению с другими методиками. Полученные результаты свидетельствуют о возможности применения предложенной системы в реальных задачах с разнотипными данными, что особенно полезно при отсутствии возможности определения относительной значимости каждого критерия.

This work is devoted to the development of a ranking method for multimodal Language Models (MLLM) in order to improve the accuracy and objectivity of their comparison. The relevance of the topic is due to the increased number of such models and the popularization of their use in various fields, which complicates the process of choosing the best algorithm in each application, as well as the lack of a universal system for evaluating their quality. The method is based on the analysis of quality metrics obtained by models based on a validation dataset, as well as their statistical properties. The procedure being developed is an improved version of the PROMETHEE method, which makes it possible to more accurately rank models based on conflicting quality criteria and takes into account the specifics of working with machine learning models. The experimental evaluation shows the advantage of this approach in comparison with other methods. The results obtained indicate the possibility of using the proposed system in real-world problems with different types of data, which is especially useful in the absence of the possibility of determining the relative importance of each criterion.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать
Интернет Авторизованные пользователи СПбПУ
Прочитать
Интернет Анонимные пользователи
  • Введение
  • Формализация задачи
  • Обзор существующих подходов
    • Метод средних
    • PCRA
    • PROMETHEE
      • Точность оценок чистых потоков
  • Предлагаемое решение
    • Применение Bootstrap
    • Анализ статистической значимости
  • Применение на реальных данных
    • Визуально-текстовая задача
    • Задача резюмирования текста
    • Интеграция с ClearML
  • Заключение
  • Список использованных источников

Количество обращений: 1 
За последние 30 дней: 1

Подробная статистика