Details
Title | Исследование возможностей ускорения работы больших языковых моделей на процессорах архитектуры RISC-V: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_02 «Основы анализа и разработки приложений с большими объемами распределенных данных» |
---|---|
Creators | Рудницкий Виталий Дмитриевич |
Scientific adviser | Черноруцкий Игорь Георгиевич |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Imprint | Санкт-Петербург, 2025 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | RISC-V ; нейронные сети ; большие языковые модели ; векторное расширения ; матричное расширение ; llama.cpp ; Qemu ; Linux ; C++ ; neural networks ; large language models ; vector expansion ; matrix expansion |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 09.04.04 |
Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-1973 |
Rights | Доступ по паролю из сети Интернет (чтение) |
Additionally | New arrival |
Record key | ru\spstu\vkr\35477 |
Record create date | 7/14/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Магистерская диссертация посвящена исследованию возможных подходов к ускорению работы больших языковых моделей на процессорах архитектуры RISC-V на основе проекта llama.cpp. Была рассмотрена структура проекта llama.cpp, изучена архитектура RISC-V на предмет возможных ускорений работы данного проекта. В ходе работы представлено несколько сборок llama.cpp на процессоры архитектуры RISC-V, с применением различных подходов к ускорению работы. Подробно рассмотрена реализация матричных вычислений в llama.cpp с использованием векторного расширения RISC-V. Представлена реализация матричных вычислений в llama.cpp с использованием матричного расширения от компании T-HEAD. Проведено тестирование полученных сборок llama.cpp при помощи эмулятора QEMU и на одноплатном компьютере Orange PI RV2.
The masters thesis is dedicated to research of possible approaches to acceleration of large language models on RISC-V architecture processors on the basis of llama.cpp project. The structure of the llama.cpp project was examined, and the RISC-V architecture was studied for possible accelerations of this project. In the course of the work several llama.cpp builds on RISC-V architecture processors are presented, using different approaches to speeding up the work. The implementation of matrix computations in llama.cpp using the RISC-V vector extension is discussed in detail. The implementation of matrix calculations in llama.cpp using the matrix extension from T-HEAD company is presented. The obtained llama.cpp assemblies are tested using QEMU emulator and on Orange PI RV2 single-board computer.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 0
Last 30 days: 0