Детальная информация

Название: Разработка антиспам-ядра для почтовых сервисов: выпускная квалификационная работа бакалавра: направление 02.03.02 «Фундаментальная информатика и информационные технологии» ; образовательная программа 02.03.02_02 «Информатика и компьютерные науки»
Авторы: Гырлов Федор Антонович
Научный руководитель: Шмаков Владимир Эдуардович
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2023
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: антиспам; машинное обучение; классификация; чёрные-списки; C++; antispam; machine learning; classification; black lists
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Бакалавриат
Код специальности ФГОС: 02.03.02
Группа специальностей ФГОС: 020000 - Компьютерные и информационные науки
DOI: 10.18720/SPBPU/3/2023/vr/vr23-3368
Права доступа: Доступ по паролю из сети Интернет (чтение)
Ключ записи: ru\spstu\vkr\22751

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Разработка средств защиты от спама актуальна, поскольку спам в электронных письмах и сообщениях представляет собой серьезную проблему для отдельных лиц, предприятий и организаций. Эти нежелательные со-общения могут перегружать почтовые системы, замедлять сетевой трафик и даже распространять вредоносные программы и вирусы. В рамках данной работы показан процесс разработки антиспам-ядра для классификации писем на спам и не спам. Классификация производится с помощью машинного обучения, такого как наивная Байесовская классификация, метода объявления черных списков для IP адресов, номеров телефонов из текста письма, email адресов отправителей, ссылок из письма. В рамках разработки использовались такие технологии и инструменты: C++ 17, Cmake, conan, git, Ms Visual Studio. В результате данной работы было создано антиспам-ядро, в котором реализованы методы Байесовской фильтрации и черные списки, при тестировании на большом наборе писем было установлено, что каждое десятое письмо определяется неправильно, то есть антиспам-ядро выдает правильный результат в 90% случаев, что является хорошим результатом для программ из сферы классификации писем.

Developing spam protection tools is relevant because spam in emails and mesages is a serious problem for individuals, businesses and organizations. These unwanted messages can overload email systems, slow down network traffic, and even spread malware and viruses. This paper shows the process of developing an anti-spam kernel to classify emails into spam and non-spam. The classification is done using machine learning such as naive Bayesian classification, blacklist declaration method for IP addresses, phone numbers from the letter text, sender email addresses, links from the letter. The technologies and tools used in the development included: C++ 17, Cmake, conan, git, Ms Visual Studio. As the result of this work the anti-spam-core was created in which meth-ods of Bayesian filtering and blacklists were realized. While testing with a large set of letters it was found that every tenth letter is defined incorrectly, that is, the anti-spam-core gives a correct result in 90% of cases and this is a good result for programs from the field of e-mail classification.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать
Интернет Авторизованные пользователи СПбПУ Прочитать
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 1
За последние 30 дней: 0
Подробная статистика