Детальная информация
Название | Исследование возможностей ускорения работы больших языковых моделей на процессорах архитектуры RISC-V: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_02 «Основы анализа и разработки приложений с большими объемами распределенных данных» |
---|---|
Авторы | Рудницкий Виталий Дмитриевич |
Научный руководитель | Черноруцкий Игорь Георгиевич |
Организация | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Выходные сведения | Санкт-Петербург, 2025 |
Коллекция | Выпускные квалификационные работы ; Общая коллекция |
Тематика | RISC-V ; нейронные сети ; большие языковые модели ; векторное расширения ; матричное расширение ; llama.cpp ; Qemu ; Linux ; C++ ; neural networks ; large language models ; vector expansion ; matrix expansion |
Тип документа | Выпускная квалификационная работа магистра |
Тип файла | |
Язык | Русский |
Уровень высшего образования | Магистратура |
Код специальности ФГОС | 09.04.04 |
Группа специальностей ФГОС | 090000 - Информатика и вычислительная техника |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-1973 |
Права доступа | Доступ по паролю из сети Интернет (чтение) |
Дополнительно | Новинка |
Ключ записи | ru\spstu\vkr\35477 |
Дата создания записи | 14.07.2025 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа | Анонимные пользователи |
---|---|
Сеть | Интернет |
Магистерская диссертация посвящена исследованию возможных подходов к ускорению работы больших языковых моделей на процессорах архитектуры RISC-V на основе проекта llama.cpp. Была рассмотрена структура проекта llama.cpp, изучена архитектура RISC-V на предмет возможных ускорений работы данного проекта. В ходе работы представлено несколько сборок llama.cpp на процессоры архитектуры RISC-V, с применением различных подходов к ускорению работы. Подробно рассмотрена реализация матричных вычислений в llama.cpp с использованием векторного расширения RISC-V. Представлена реализация матричных вычислений в llama.cpp с использованием матричного расширения от компании T-HEAD. Проведено тестирование полученных сборок llama.cpp при помощи эмулятора QEMU и на одноплатном компьютере Orange PI RV2.
The masters thesis is dedicated to research of possible approaches to acceleration of large language models on RISC-V architecture processors on the basis of llama.cpp project. The structure of the llama.cpp project was examined, and the RISC-V architecture was studied for possible accelerations of this project. In the course of the work several llama.cpp builds on RISC-V architecture processors are presented, using different approaches to speeding up the work. The implementation of matrix computations in llama.cpp using the RISC-V vector extension is discussed in detail. The implementation of matrix calculations in llama.cpp using the matrix extension from T-HEAD company is presented. The obtained llama.cpp assemblies are tested using QEMU emulator and on Orange PI RV2 single-board computer.
Место доступа | Группа пользователей | Действие |
---|---|---|
Локальная сеть ИБК СПбПУ | Все |
|
Интернет | Авторизованные пользователи СПбПУ |
|
Интернет | Анонимные пользователи |
|
Количество обращений: 0
За последние 30 дней: 0