Детальная информация

Название Исследование возможностей ускорения работы больших языковых моделей на процессорах архитектуры RISC-V: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_02 «Основы анализа и разработки приложений с большими объемами распределенных данных»
Авторы Рудницкий Виталий Дмитриевич
Научный руководитель Черноруцкий Игорь Георгиевич
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения Санкт-Петербург, 2025
Коллекция Выпускные квалификационные работы ; Общая коллекция
Тематика RISC-V ; нейронные сети ; большие языковые модели ; векторное расширения ; матричное расширение ; llama.cpp ; Qemu ; Linux ; C++ ; neural networks ; large language models ; vector expansion ; matrix expansion
Тип документа Выпускная квалификационная работа магистра
Тип файла PDF
Язык Русский
Уровень высшего образования Магистратура
Код специальности ФГОС 09.04.04
Группа специальностей ФГОС 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2025/vr/vr25-1973
Права доступа Доступ по паролю из сети Интернет (чтение)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\35477
Дата создания записи 14.07.2025

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Магистерская диссертация посвящена исследованию возможных подходов к ускорению работы больших языковых моделей на процессорах архитектуры RISC-V на основе проекта llama.cpp. Была рассмотрена структура проекта llama.cpp, изучена архитектура RISC-V на предмет возможных ускорений работы данного проекта. В ходе работы представлено несколько сборок llama.cpp на процессоры архитектуры RISC-V, с применением различных подходов к ускорению работы. Подробно рассмотрена реализация матричных вычислений в llama.cpp с использованием векторного расширения RISC-V. Представлена реализация матричных вычислений в llama.cpp с использованием матричного расширения от компании T-HEAD. Проведено тестирование полученных сборок llama.cpp при помощи эмулятора QEMU и на одноплатном компьютере Orange PI RV2.

The masters thesis is dedicated to research of possible approaches to acceleration of large language models on RISC-V architecture processors on the basis of llama.cpp project. The structure of the llama.cpp project was examined, and the RISC-V architecture was studied for possible accelerations of this project. In the course of the work several llama.cpp builds on RISC-V architecture processors are presented, using different approaches to speeding up the work. The implementation of matrix computations in llama.cpp using the RISC-V vector extension is discussed in detail. The implementation of matrix calculations in llama.cpp using the matrix extension from T-HEAD company is presented. The obtained llama.cpp assemblies are tested using QEMU emulator and on Orange PI RV2 single-board computer.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать
Интернет Авторизованные пользователи СПбПУ
Прочитать
Интернет Анонимные пользователи

Количество обращений: 0 
За последние 30 дней: 0

Подробная статистика