Оглавление:
Определение - Что означает Наивный Байес?
Наивный байесовский классификатор - это алгоритм, который использует теорему Байеса для классификации объектов. Наивные байесовские классификаторы предполагают сильную или наивную независимость между атрибутами точек данных. Популярное использование наивных байесовских классификаторов включает спам-фильтры, анализ текста и медицинскую диагностику. Эти классификаторы широко используются для машинного обучения, потому что они просты в реализации.
Наивный байесовский также известен как простой байесовский или независимый байесовский.
Техопедия объясняет наивный байесовский
Наивный байесовский классификатор использует теорию вероятностей для классификации данных. Наивные алгоритмы байесовского классификатора используют теорему Байеса. Основное понимание теоремы Байеса заключается в том, что вероятность события может быть скорректирована по мере поступления новых данных.
Что делает наивный байесовский классификатор наивным, так это его предположение о том, что все атрибуты рассматриваемой точки данных независимы друг от друга. Классификатор, сортирующий фрукты на яблоки и апельсины, знал бы, что яблоки красные, круглые и имеют определенный размер, но не принимал бы все эти вещи сразу. Апельсины тоже круглые.
Наивный байесовский классификатор - это не отдельный алгоритм, а семейство алгоритмов машинного обучения, которые используют статистическую независимость. Эти алгоритмы относительно просты в написании и работают более эффективно, чем более сложные алгоритмы Байеса.
Самым популярным приложением являются спам-фильтры. Фильтр спама просматривает сообщения электронной почты на наличие определенных ключевых слов и помещает их в папку для спама, если они совпадают.
Несмотря на название, чем больше данных он получает, тем точнее становится наивный байесовский классификатор, например, от пользователя, помечающего сообщения электронной почты в папке «Входящие» для спама.