Детальная информация

Название: Классификатор блоков кодирования: выпускная квалификационная работа бакалавра: направление 09.03.04 «Программная инженерия» ; образовательная программа 09.03.04_01 «Технология разработки и сопровождения качественного программного продукта»
Авторы: Мэн Цзянин
Научный руководитель: Черноруцкий Игорь Георгиевич
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2023
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: машинное обучение; алгоритм классификации; классификатор; предсказание классификации; контролируемое обучение; алгоритм; блок кодирования; machine learning; classification algorithm; classifier; classification prediction; supervised learning; algorithm; coding block
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Бакалавриат
Код специальности ФГОС: 09.03.04
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2023/vr/vr23-3827
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: ru\spstu\vkr\23054

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Тема выпускной квалификационной работы: «Классификатор блоков кодирования». В данной работе представлен новый алгоритм (Coding unit classification algorithm, CUCL) для решения проблемы предсказания классификации в машинном обучении. CUCL вдохновлен блоком дерева кодирования (Coding Tree Unit, CTU) в высокоэффективное кодирование видеоизображений (High Efficiency Video Coding, HEVC также известное как H.265) [1]. Блок дерева кодирования является основным блоком кодирования HEVC, заменяя использовавшийся ранее макроблоков 16x16 пикселей. CTU повышает эффективность кодирования за счет использования блочной структуры переменного размера, которая подразделяет изображение на блоки пикселей переменного размера, что обычно повышает эффективность при кодировании. Классификатор блоков кодирования (Coding unit classifier, CUC) был разработан на основе идеи блоков кодирования в дереве кодирования. Блоки кодирования (Coding unit, CU), содержащиеся в классификаторе блоков кодирования, строятся в три этапа: "предварительная сегментация", " уточненная сегментация" и "заражение", которые также образуют оценщик. Для новых точек выборки, вводимых в CUC, целевое значение предсказывается по блоку, к которому оно должно принадлежать. Кроме того, мы предлагаем метод устранения шума в наборе данных или уменьшения влияния выбросов на производительность классификатора путем настройки гиперпараметров CUC. В финальном тестировании CUC смог быстро построить оценщик и достичь точности >0.95 на тестовом наборе для различных количеств и распределений наборов данных точек выборки. В данной работе были использованы следующие библиотеки и инструменты drawio, git, numpy, pandas, Matplotlib и scikit-learn, язык разработки - Python3.9, а в качестве сред разработки и тестирования использовался PyCharm.

The topic of the final qualifying work: “Coding unit classifier”. In this paper, we propose a new algorithm, Coding unit classification algorithm (CUCL), for solving the classification prediction problem in machine learning. The algorithm is inspired by the Coding Tree Unit (CTU) in High Efficiency Video Coding (HEVC, also known as H.265). The coding tree unit is the basic encoding unit of HEVC, replacing the 16×16 pixel macro blocks used in the past. The coding tree unit improves the efficiency of encoding by using a variable-sized block structure that subdivides the image into variable-sized pixel blocks, which usually increases the efficiency of encoding. We developed a Coding unit classifier (CUC) based on the idea of coding units in a coding tree. The coding unit classifier contains coding units (CU) that are constructed in three steps: "pre-segmentation", "refinement segmentation" and "infection", which also form the These coding units also form the estimator. For new sample points entered into the CUC, the target value is predicted by the coding unit to which they should belong. In addition, we propose a method to eliminate noise in the dataset or reduce the impact of outliers on the classifier performance by configuring the hyperparameters of the CUC. In the final test, the CUC was able to build predictors very quickly and achieve an accuracy of >0.95 for the test set for different number of sample points and sample point distributions. In this work, the following libraries and tools drawio, git, numpy, pandas, Matplotlib and scikit-learn were used, the development language was Python 3.9, and PyCharm was used as the development and testing environment.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 2
За последние 30 дней: 0
Подробная статистика