Table | Card | RUSMARC | |
Allowed Actions: –
Action 'Read' will be available if you login or access site from another network
Group: Anonymous Network: Internet |
Annotation
Учебное пособие содержит базовые материалы для изучения архитектуры Nvidia CUDA и руководство по выполнению курсовой работы. Приведён пример выполнения курсовой работы. Приведены постановка задачи, алгоритм распараллеливания, технология подключения задачи к ресурсам суперЭВМ, исследование временных характеристик поставленной задачи от значений параметров вычислительной среды. Методические рекомендации предназначены для студентов направлений подготовки бакалавров по направлениям «Математика и компьютерные науки» и «Математическое обеспечение и администрирование информационных систем».
Document access rights
Network | User group | Action | ||||
---|---|---|---|---|---|---|
ILC SPbPU Local Network | All | |||||
Internet | Anonymous |
Table of Contents
- Содержание
- Введение
- 1. Аппаратно-программная архитектура Nvidia CUDA
- 1.1. Устройство GPU Nvidia
- 1.2. SIMT модель
- 1.3. Микроархитектура Fermi
- 1.4. Микроархитектура Kepler
- 1.5. Микроархитектура Maxwell
- 1.6. Микроархитектура Pascal
- 1.7. Микроархитектура Tesla
- 2. Введение в CUDA C
- 2.1. Устройство памяти
- 2.2. Работа с глобальной памятью GPU
- 2.3. Константная память
- 2.4. Текстурная память
- 2.5. Разделенная память
- 2.6. Ядро
- 2.7. Средства коммуникации между потоками
- 2.8. Барьер синхронизации
- 2.9. Измерение времени выполнения ядра с помощью механизма событий
- 2.10.Измерение времени выполнения ядра с помощью механизма событий
- 2.11.Потоки в CUDA C
- 3. Установка Nvidia CUDA Toolkit
- 4. Программирование на CUDA C
- 4.1. Основная (глобальная) память
- 4.2. Компоновка тредов и блоков
- 4.3. Константная память
- 4.4. Разделяемая память
- 4.5. Текстурная память
- 4.6. Атомарные операции
- 4.7. Параллельный запуск нескольких ядер на GPU
- 4.8. Асинхронное копирование данных и блокированная память
- 4.9. Использование памяти CPU
- 4.10. Операции с матрицами
- 4.11. Оценка затраченного на вычисления времени
- 5. Организация вычислителей в «Политехник - РСК Торнадо» и «Политехник - РСК Петаст-рим»
- 5.1. Доступные ресурсы
- 5.2. Доступ к ресурсам
- 5.3. Создание SSH-ключей
- 5.4. Создание SSH-ключей на Unix-системах
- 5.5. Создание SSH-ключей на Windows системах
- 5.6. Настройка окружения
- 5.7. Запуск задач
- 6. Пример решения практической задачи
- 6.1. Постановка задачи
- 6.2. Алгоритм решения задачи
- 6.3. Описание эксперимента
- 6.4. Анализ результатов
- Заключение
- Список литературы
Usage statistics
Access count: 0
Last 30 days: 0 Detailed usage statistics |