Детальная информация

Название Исследование и сравнительный анализ эффективности программной и аппаратных реализаций операции суммирования транспонированных матриц // Информатика, телекоммуникации и управление. – 2022. – Vol. 15, № 4. — С. 51-63
Авторы Антонов А. П. ; Беседин Д. С. ; Филиппов А. С.
Выходные сведения 2022
Коллекция Общая коллекция
Тематика Вычислительная техника ; Блоки обработки данных ; транспонированные матрицы ; суммирование транспонированных матриц ; сравнительный анализ ; аппаратная реализация (вычислительная техника) ; параллельные вычисления ; конвейеризация (вычислительная техника) ; производительность аппаратных реализаций ; transposed matrices ; summation of transposed matrices ; comparative analysis ; hardware implementation (computing) ; parallel computing ; pipelining (computing) ; performance of hardware implementations
УДК 004.31
ББК 32.973-04
Тип документа Статья, доклад
Язык Русский
DOI 10.18721/JCSTCS.15404
Права доступа Свободный доступ из сети Интернет (чтение, печать, копирование)
Ключ записи RU\SPSTU\edoc\70547
Дата создания записи 21.04.2023

Разрешенные действия

Прочитать Загрузить (0,8 Мб)

Группа Анонимные пользователи
Сеть Интернет

Статья посвящена исследованию и сравнительному анализу программной и аппаратной реализации операции суммирования транспонированных матриц и её модифицированного варианта: операции транспонирования суммы матриц. Особенностью исследования является использование для получения аппаратной реализации средств высокоуровневого синтеза. Актуальность исследования обусловлена широким использованием матричных операций для решения задач различных классов, степенной асимптотической сложностью матричных вычислений и отсутствием данных об использовании данного инструментария в задачах создания аппаратных устройств для матричных вычислений. Предложен пошаговый метод синтеза и оптимизации аппаратного устройства. Проведено сравнительное исследование программных и аппаратных реализаций двух вычислительных задач. Показано, что большой выигрыш производительности аппаратных реализаций получается за счет увеличения степени параллелизма вычислений. Дополнительно сделаны выводы о неэффективности попыток достичь высоких тактовых частот, а также об увеличении затрачиваемых ресурсов при увеличении быстродействия за счет распараллеливания.

The article is devoted to the study and comparative analysis of the software and hardware implementation of the operation of summing transposed matrices and its modified version – the operation of transposing the sum of matrices. A feature of the study is the use of high-level synthesis tools to obtain a hardware implementation. The relevance of the study is due to the widespread use of matrix operations for solving problems of various classes, the power asymptotic complexity of matrix calculations and the lack of data on the use of this toolkit in the tasks of creating hardware devices for matrix calculations. A step-by-step method of synthesis and optimization of a hardware device is proposed. A comparative study of software and hardware implementations of two computational tasks is carried out. It is shown that a large gain in the performance of hardware implementations is obtained by increasing the degree of parallelism of calculations. Additionally, conclusions are drawn about the inefficiency of attempts to achieve high clock frequencies, as well as about the increase in resources spent with increased speed due to parallelization.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать Печать Загрузить
Интернет Все

Количество обращений: 325 
За последние 30 дней: 22

Подробная статистика