Details

Title: Исследование и сравнительный анализ эффективности программной и аппаратных реализаций операции суммирования транспонированных матриц // Информатика, телекоммуникации и управление. – 2022. – С. 51-63
Creators: Антонов А. П.; Беседин Д. С.; Филиппов А. С.
Imprint: 2022
Collection: Общая коллекция
Subjects: Вычислительная техника; Блоки обработки данных; транспонированные матрицы; суммирование транспонированных матриц; сравнительный анализ; аппаратная реализация (вычислительная техника); параллельные вычисления; конвейеризация (вычислительная техника); производительность аппаратных реализаций; transposed matrices; summation of transposed matrices; comparative analysis; hardware implementation (computing); parallel computing; pipelining (computing); performance of hardware implementations
UDC: 004.31
LBC: 32.973-04
Document type: Article, report
File type: PDF
Language: Russian
DOI: 10.18721/JCSTCS.15404
Rights: Свободный доступ из сети Интернет (чтение, печать, копирование)
Record key: RU\SPSTU\edoc\70547

Allowed Actions: Read Download (0.8 Mb)

Group: Anonymous

Network: Internet

Annotation

Статья посвящена исследованию и сравнительному анализу программной и аппаратной реализации операции суммирования транспонированных матриц и её модифицированного варианта: операции транспонирования суммы матриц. Особенностью исследования является использование для получения аппаратной реализации средств высокоуровневого синтеза. Актуальность исследования обусловлена широким использованием матричных операций для решения задач различных классов, степенной асимптотической сложностью матричных вычислений и отсутствием данных об использовании данного инструментария в задачах создания аппаратных устройств для матричных вычислений. Предложен пошаговый метод синтеза и оптимизации аппаратного устройства. Проведено сравнительное исследование программных и аппаратных реализаций двух вычислительных задач. Показано, что большой выигрыш производительности аппаратных реализаций получается за счет увеличения степени параллелизма вычислений. Дополнительно сделаны выводы о неэффективности попыток достичь высоких тактовых частот, а также об увеличении затрачиваемых ресурсов при увеличении быстродействия за счет распараллеливания.

The article is devoted to the study and comparative analysis of the software and hardware implementation of the operation of summing transposed matrices and its modified version – the operation of transposing the sum of matrices. A feature of the study is the use of high-level synthesis tools to obtain a hardware implementation. The relevance of the study is due to the widespread use of matrix operations for solving problems of various classes, the power asymptotic complexity of matrix calculations and the lack of data on the use of this toolkit in the tasks of creating hardware devices for matrix calculations. A step-by-step method of synthesis and optimization of a hardware device is proposed. A comparative study of software and hardware implementations of two computational tasks is carried out. It is shown that a large gain in the performance of hardware implementations is obtained by increasing the degree of parallelism of calculations. Additionally, conclusions are drawn about the inefficiency of attempts to achieve high clock frequencies, as well as about the increase in resources spent with increased speed due to parallelization.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
-> Internet All Read Print Download

Usage statistics

stat Access count: 92
Last 30 days: 10
Detailed usage statistics