Details

Title: Управление ресурсами суперЭВМ: учебное пособие
Creators: Попов Сергей Геннадьевич; Чуватов Михаил Владимирович; Силиненко Александр Витальевич
Organization: Санкт-Петербургский политехнический университет Петра Великого
Imprint: Санкт-Петербург, 2022
Collection: Учебная и учебно-методическая литература; Общая коллекция
Subjects: Супер-ЭВМ; Вычислительные машины электронные персональные; параллельные процессы и алгоритмы; курсовые работы; учебники и пособия для вузов
UDC: 004.382.7(075.8)
Document type: Tutorial
File type: PDF
Language: Russian
Speciality code (FGOS): 02.03.01
Speciality group (FGOS): 020000 - Компьютерные и информационные науки
DOI: 10.18720/SPBPU/5/tr22-72
Rights: Доступ из локальной сети ИБК СПбПУ (чтение, печать)
Record key: RU\SPSTU\edoc\68184

Allowed Actions:

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Учебное пособие содержит базовые материалы для изучения архитектуры Nvidia CUDA и руководство по выполнению курсовой работы. Приведён пример выполнения курсовой работы. Приведены постановка задачи, алгоритм распараллеливания, технология подключения задачи к ресурсам суперЭВМ, исследование временных характеристик поставленной задачи от значений параметров вычислительной среды. Методические рекомендации предназначены для студентов направлений подготовки бакалавров по направлениям «Математика и компьютерные науки» и «Математическое обеспечение и администрирование информационных систем».

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print
-> Internet Anonymous

Table of Contents

  • Содержание
  • Введение
  • 1. Аппаратно-программная архитектура Nvidia CUDA
    • 1.1. Устройство GPU Nvidia
    • 1.2. SIMT модель
    • 1.3. Микроархитектура Fermi
    • 1.4. Микроархитектура Kepler
    • 1.5. Микроархитектура Maxwell
    • 1.6. Микроархитектура Pascal
    • 1.7. Микроархитектура Tesla
  • 2. Введение в CUDA C
    • 2.1. Устройство памяти
    • 2.2. Работа с глобальной памятью GPU
    • 2.3. Константная память
    • 2.4. Текстурная память
    • 2.5. Разделенная память
    • 2.6. Ядро
    • 2.7. Средства коммуникации между потоками
    • 2.8. Барьер синхронизации
    • 2.9. Измерение времени выполнения ядра с помощью механизма событий
    • 2.10.Измерение времени выполнения ядра с помощью механизма событий
    • 2.11.Потоки в CUDA C
  • 3. Установка Nvidia CUDA Toolkit
  • 4. Программирование на CUDA C
    • 4.1. Основная (глобальная) память
    • 4.2. Компоновка тредов и блоков
    • 4.3. Константная память
    • 4.4. Разделяемая память
    • 4.5. Текстурная память
    • 4.6. Атомарные операции
    • 4.7. Параллельный запуск нескольких ядер на GPU
    • 4.8. Асинхронное копирование данных и блокированная память
    • 4.9. Использование памяти CPU
    • 4.10. Операции с матрицами
    • 4.11. Оценка затраченного на вычисления времени
  • 5. Организация вычислителей в «Политехник - РСК Торнадо» и «Политехник - РСК Петаст-рим»
    • 5.1. Доступные ресурсы
    • 5.2. Доступ к ресурсам
    • 5.3. Создание SSH-ключей
    • 5.4. Создание SSH-ключей на Unix-системах
    • 5.5. Создание SSH-ключей на Windows системах
    • 5.6. Настройка окружения
    • 5.7. Запуск задач
  • 6. Пример решения практической задачи
    • 6.1. Постановка задачи
    • 6.2. Алгоритм решения задачи
    • 6.3. Описание эксперимента
    • 6.4. Анализ результатов
  • Заключение
  • Список литературы

Usage statistics

stat Access count: 0
Last 30 days: 0
Detailed usage statistics