Q:
Почему визуализация данных полезна для алгоритмов машинного обучения?
A:Дисциплина визуализации данных дает нам практически бесконечные способы показать, что происходит с алгоритмами машинного обучения. Стоит задуматься о том, почему именно визуализация данных так важна и почему она высвобождает столько творческой силы для многих людей, которые вовлечены в процессы машинного обучения.
Чтобы понять значение визуализации данных для машинного обучения, просто взгляните на любой из алгоритмов, которые используются для создания этих новаторских и инновационных программ.
Одним из самых простых является дерево решений. Не входя в функции активации или скрытые слои или что-либо подобное, дерево решений - это просто наборы двоичных узлов. Но даже простое дерево решений очень сложно для людей описать или написать. Это намного проще, когда это визуализируется на экране или на странице. Когда вы видите каждый узел и его соединения с другими узлами, все становится очевидным.
Теперь давайте возьмем один из самых византийских и сложных типов алгоритма машинного обучения - нейронную сеть.
В некотором смысле, нейронные сети действительно представляют собой наборы алгоритмов машинного обучения. Базовая настройка состоит из входного слоя, скрытых слоев и выходного слоя. Функции активации помогают отдельным цифровым нейронам обрабатывать взвешенные входные данные.
Все эти элементы и все эти процессы гораздо легче объяснить с помощью визуализации данных, чем с помощью устных или письменных описаний. Вы можете сказать, что нейронная сеть имеет взвешенные входные данные, поступающие во входной слой, и что они объединяются в некоторый скрытый слой и объединяются в заданный выходной сигнал, но когда вы используете визуальный рисунок, чтобы показать, как это работает, человеческий глаз и человеческий Мозг заманивает это в ловушку гораздо более прямым и полезным способом.
В некотором смысле вы можете увидеть всю мощь визуализации данных даже без учета машинного обучения. Еще во времена линейного программирования компиляторы и студии компьютерного языка давали программистам возможность выбрать пошаговую тестовую программу, где они могли бы проверять значения переменных в маленьких визуальных блоках. Опять же, это помогло показать, что происходит при выполнении гораздо лучше, чем просто чтение базы кода.
Машинное обучение - это гиперинтенсивное программирование - это вероятностное программирование, и поэтому визуализация данных действительно помогает нам понять, что происходит с любым конкретным алгоритмом или процессом.