Q:
Почему путаница полезна в ML?
A:Есть несколько способов поговорить о том, почему матрица путаницы полезна в машинном обучении (ML), но один из самых простых способов - объяснить, что матрица путаницы является ресурсом визуализации данных.
Путаница матрица позволяет зрителям сразу увидеть результаты использования классификатора или другого алгоритма. Используя простую таблицу для отображения аналитических результатов, матрица путаницы, по сути, сводит ваши результаты в более удобочитаемое представление.
Матрица путаницы использует специальную терминологию для упорядочения результатов. Есть истинные положительные и отрицательные стороны, а также ложные положительные и отрицательные. Для более сложной матрицы путаницы или матрицы, основанной на сравнительной классификации, эти значения могут быть показаны как действительные и прогнозируемые классы для двух разных объектов.
Независимо от семантической терминологии, результаты сгруппированы в квадратную (или прямоугольную) таблицу.
Это представление позволяет аналитикам увидеть, насколько точным был алгоритм при классификации результатов. (Прочтите Новые генераторы, чтобы современные алгоритмы работали над ASCII Art.)
Полезность матрицы путаницы связана со сложностью проектов ОД, а также с тем, как информация форматируется и доставляется пользователям. Представьте себе цепочку линейных результатов, включая ложные срабатывания, ложные отрицания, истинные положительные и истинные отрицательные. (Читайте Машинное обучение 101.)
Пользователь должен будет свести все эти линейные результаты в график, чтобы понять, как работает алгоритм и насколько он точен. С помощью матрицы путаницы эта информация просто представлена в мощной визуальной модели.
Например, предположим, что машине предлагается классифицировать 20 изображений, из которых пять - фрукты, а пять - овощи. Если запутанная матрица содержит следующее содержимое (сверху слева по часовой стрелке): 7, 5, 3, 5, то матрица показывает, что семь были правильно определены как овощи, а три были правильно классифицированы как фрукты.
Другие 10, как представлено, являются результатами, в которых программе не удалось правильно идентифицировать изображение.
Матрица путаницы будет полезна во всех видах аналитики ML. Наблюдая за этим ресурсом, пользователи могут выяснить, как справляться с такими проблемами, как размерность и переоснащение, и другими способами оптимизации алгоритма.