Details

Title: Research and comparative analysis of the effectiveness of software and hardware implementations of transposed matrix multiplication // Информатика, телекоммуникации и управление. – 2024. – Т. 17, № 1. — С. 44-53
Creators: Antonov A. P.; Besedin D. S.; Filippov A. S.
Imprint: 2024
Collection: Общая коллекция
Subjects: Вычислительная техника; Блоки обработки данных; matrix multiplication; transposed matrix multiplication; hardware implementations; FPGA; programmable logic-integrated systems; parallel computing; conveyor processing; матричное умножение; транспонированное матричное умножение; аппаратные реализации; ПЛИС; программируемые логически-интегральные системы; параллельные вычисления; конвейерная обработка
UDC: 004.31
LBC: 32.973-04
Document type: Article, report
File type: PDF
Language: English
DOI: 10.18721/JCSTCS.17104
Rights: Свободный доступ из сети Интернет (чтение, печать, копирование)
Additionally: New arrival
Record key: RU\SPSTU\edoc\73006

Allowed Actions: Read Download (0.6 Mb)

Group: Anonymous

Network: Internet

Annotation

The article is devoted to the study and comparative analysis of the software and hardware implementation of the transposed matrix multiplication operation and its modified version, the matrix multiplication transpose. A feature of this study is the use of high-level synthesis tools to obtain and optimize hardware implementations of these operations. The relevance of this study is due to the widespread use of matrix operations, such as transposition and multiplication, to solve various applied problems, the power-law asymptotic complexity of matrix calculations and the lack of data on the effectiveness of using high-level synthesis tools in the tasks of creating hardware devices for matrix calculations. A step-by-step method for synthesizing and optimizing the hardware implementation of these operations is proposed. A comparative study of the software and hardware implementations of these two operations was carried out. It is shown that the gain in performance of hardware implementations is achieved by increasing the degree of parallelism of matrix calculations. Additionally, studies were conducted on the required resources while increasing productivity through parallelization.

Статья посвящена исследованию и сравнительному анализу программной и аппаратной реализации операции транспонированного матричного умножения и ее модифицированной версии - операции транспонирования матричного умножения. Особенностью данного исследования является использование высокоуровневых средств синтеза для получения и оптимизации аппаратных реализаций указанных операций. Актуальность данного исследования обусловлена широким использованием матричных операций, таких как транспонирование и умножение, для решения различных прикладных задач, степенной асимптотической сложностью матричных вычислений и отсутствием данных об эффективности использования высокоуровневых средств синтеза в задачах создания аппаратных устройств для матричных вычислений. Предложен пошаговый метод синтеза и оптимизации аппаратной реализации указанных операций. Проведено сравнительное исследование программной и аппаратной реализаций двух указанных операций. Показано, что выигрыш в производительности аппаратных реализаций достигается за счет увеличения степени параллелизма матричных вычислений. Дополнительно были проведены исследования требуемых ресурсов при повышении производительности за счет распараллеливания.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
-> Internet All Read Print Download

Usage statistics

stat Access count: 9
Last 30 days: 9
Detailed usage statistics