Оглавление:
Определение - что означает Байесовский фильтр?
Байесовский фильтр - это компьютерная программа, использующая байесовскую логику или байесовский анализ, которые являются синонимами. Он используется для оценки заголовка и содержания сообщений электронной почты и определения того, является ли он нежелательной почтой или электронным эквивалентом обычной или нежелательной почты). Байесовский фильтр лучше всего использовать вместе с антивирусными программами.
Техопедия объясняет байесовский фильтр
Байесовский фильтр работает с вероятностями появления определенных слов в заголовке или содержимом письма. Определенные слова указывают на высокую вероятность того, что электронная почта является спамом, например виагра и рефинансирование. Фильтр не запускается, зная вероятность того, что слово указывает на высокую вероятность спама. Пользователи должны вручную идентифицировать электронную почту как спам. Когда найдены достаточные вхождения слова и электронное письмо идентифицировано как спам, байесовский фильтр «учится» определять слово, используя функции правдоподобия. То же самое происходит со многими другими словами и фразами. Со временем байесовский фильтр становится все более и более эффективным для выявления спама для конкретного пользователя. Когда вероятность достигает определенного порога, например 95 процентов, электронное письмо идентифицируется как спам и часто перемещается в папку нежелательной почты (а иногда даже удаляется автоматически). Пользователь может периодически просматривать его и решать, удалять его или нет. Кроме того, некоторые спам-программы перемещают его в карантин, где пользователи могут просматривать электронную почту и просматривать решение программного обеспечения.
Первоначальная «тренировка» часто может быть улучшена, чтобы уменьшить количество ложных срабатываний или ложных отрицательных результатов при обнаружении неправильных суждений. Это позволяет байесовскому фильтру программного обеспечения адаптироваться к постоянно меняющейся природе спама.
Некоторые спам-фильтры также используют эвристику наряду с байесовским фильтром. Предустановленные правила настраиваются пользователем для дальнейшего повышения точности идентификации электронной почты как спама. Эти правила могут включать количество вхождений данного слова, исключать или игнорировать нейтральные слова, такие как «the», «a» или «some», или идентифицировать последовательности работ, таких как «Viagra is good for», в отличие от применения вероятности функция для всех четырех отдельных слов.
Спаммеры могут использовать технику, называемую байесовским отравлением, чтобы снизить эффективность фильтров спама с использованием байесовской фильтрации. Некоторые методы включают введение законного текста из новостей или литературных источников, использование случайных безобидных слов, редко встречающихся в спаме, или даже замену текста картинками.
Многие почтовые клиенты отключают отображение изображений по соображениям безопасности. Таким образом, спам может достигать меньше получателей.
Байесовский фильтр, использующий байесовскую логику, можно использовать для классификации данных любого типа. Медицина, наука и инженерия нашли применение. Интересно, что научные исследователи предполагают, что даже человеческий мозг может использовать методологию Байеса для классификации стимулов и определения специфических поведенческих реакций.
