Details

Title Исследование возможностей ускорения работы больших языковых моделей на процессорах архитектуры RISC-V: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_02 «Основы анализа и разработки приложений с большими объемами распределенных данных»
Creators Рудницкий Виталий Дмитриевич
Scientific adviser Черноруцкий Игорь Георгиевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects RISC-V ; нейронные сети ; большие языковые модели ; векторное расширения ; матричное расширение ; llama.cpp ; Qemu ; Linux ; C++ ; neural networks ; large language models ; vector expansion ; matrix expansion
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 09.04.04
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2025/vr/vr25-1973
Rights Доступ по паролю из сети Интернет (чтение)
Additionally New arrival
Record key ru\spstu\vkr\35477
Record create date 7/14/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

Магистерская диссертация посвящена исследованию возможных подходов к ускорению работы больших языковых моделей на процессорах архитектуры RISC-V на основе проекта llama.cpp. Была рассмотрена структура проекта llama.cpp, изучена архитектура RISC-V на предмет возможных ускорений работы данного проекта. В ходе работы представлено несколько сборок llama.cpp на процессоры архитектуры RISC-V, с применением различных подходов к ускорению работы. Подробно рассмотрена реализация матричных вычислений в llama.cpp с использованием векторного расширения RISC-V. Представлена реализация матричных вычислений в llama.cpp с использованием матричного расширения от компании T-HEAD. Проведено тестирование полученных сборок llama.cpp при помощи эмулятора QEMU и на одноплатном компьютере Orange PI RV2.

The masters thesis is dedicated to research of possible approaches to acceleration of large language models on RISC-V architecture processors on the basis of llama.cpp project. The structure of the llama.cpp project was examined, and the RISC-V architecture was studied for possible accelerations of this project. In the course of the work several llama.cpp builds on RISC-V architecture processors are presented, using different approaches to speeding up the work. The implementation of matrix computations in llama.cpp using the RISC-V vector extension is discussed in detail. The implementation of matrix calculations in llama.cpp using the matrix extension from T-HEAD company is presented. The obtained llama.cpp assemblies are tested using QEMU emulator and on Orange PI RV2 single-board computer.

Network User group Action
ILC SPbPU Local Network All
Read
Internet Authorized users SPbPU
Read
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics