Details

Title: Разработка антиспам-ядра для почтовых сервисов: выпускная квалификационная работа бакалавра: направление 02.03.02 «Фундаментальная информатика и информационные технологии» ; образовательная программа 02.03.02_02 «Информатика и компьютерные науки»
Creators: Гырлов Федор Антонович
Scientific adviser: Шмаков Владимир Эдуардович
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2023
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: антиспам; машинное обучение; классификация; чёрные-списки; C++; antispam; machine learning; classification; black lists
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Level of education: Bachelor
Speciality code (FGOS): 02.03.02
Speciality group (FGOS): 020000 - Компьютерные и информационные науки
DOI: 10.18720/SPBPU/3/2023/vr/vr23-3368
Rights: Доступ по паролю из сети Интернет (чтение)
Record key: ru\spstu\vkr\22751

Allowed Actions:

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Разработка средств защиты от спама актуальна, поскольку спам в электронных письмах и сообщениях представляет собой серьезную проблему для отдельных лиц, предприятий и организаций. Эти нежелательные со-общения могут перегружать почтовые системы, замедлять сетевой трафик и даже распространять вредоносные программы и вирусы. В рамках данной работы показан процесс разработки антиспам-ядра для классификации писем на спам и не спам. Классификация производится с помощью машинного обучения, такого как наивная Байесовская классификация, метода объявления черных списков для IP адресов, номеров телефонов из текста письма, email адресов отправителей, ссылок из письма. В рамках разработки использовались такие технологии и инструменты: C++ 17, Cmake, conan, git, Ms Visual Studio. В результате данной работы было создано антиспам-ядро, в котором реализованы методы Байесовской фильтрации и черные списки, при тестировании на большом наборе писем было установлено, что каждое десятое письмо определяется неправильно, то есть антиспам-ядро выдает правильный результат в 90% случаев, что является хорошим результатом для программ из сферы классификации писем.

Developing spam protection tools is relevant because spam in emails and mesages is a serious problem for individuals, businesses and organizations. These unwanted messages can overload email systems, slow down network traffic, and even spread malware and viruses. This paper shows the process of developing an anti-spam kernel to classify emails into spam and non-spam. The classification is done using machine learning such as naive Bayesian classification, blacklist declaration method for IP addresses, phone numbers from the letter text, sender email addresses, links from the letter. The technologies and tools used in the development included: C++ 17, Cmake, conan, git, Ms Visual Studio. As the result of this work the anti-spam-core was created in which meth-ods of Bayesian filtering and blacklists were realized. While testing with a large set of letters it was found that every tenth letter is defined incorrectly, that is, the anti-spam-core gives a correct result in 90% of cases and this is a good result for programs from the field of e-mail classification.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read
Internet Authorized users SPbPU Read
-> Internet Anonymous

Usage statistics

stat Access count: 1
Last 30 days: 0
Detailed usage statistics