Q:
Почему смещение машины является проблемой в машинном обучении?
A:На этот вопрос можно ответить двумя различными способами. Во-первых, почему проблема смещения машины, а именно, почему она существует в процессах машинного обучения?
Машинное обучение, хотя и сложное и сложное, в некоторой степени ограничено основанными на наборах данных, которые оно использует. Построение наборов данных включает в себя смещение. Точно так же, как в средствах массовой информации, где упущения и преднамеренный выбор включения могут демонстрировать конкретную предвзятость, в машинном обучении необходимо использовать наборы данных, чтобы определить, какой тип предвзятости существует.
Скачать бесплатно: машинное обучение и почему это важно |
Например, для технологических испытаний и процессов проектирования характерна проблема показать предпочтение одного типа пользователя другому. Одним из ярких примеров является гендерное неравенство в мире технологий.
Почему это имеет значение, и почему это относится к машинному обучению?
Поскольку отсутствие существующих женщин в среде тестирования может привести к созданию технологии, которая будет менее удобной для женской аудитории. Некоторые эксперты описывают это так, что без существующего женского тестирования конечный продукт может не распознавать вклад женщин-пользователей - у него могут не быть инструментов для распознавания женской идентичности или для адекватного реагирования на вклад женщин.
То же самое относится к разным этническим группам, людям разных религий или любому другому типу демографии. Без правильных данных алгоритмы машинного обучения не будут работать правильно для данного пользовательского набора, поэтому данные включения должны быть преднамеренно добавлены в технологию. Вместо того, чтобы просто брать первичные наборы данных и усиливать пристрастное предубеждение, люди-обработчики должны по-настоящему взглянуть на проблему.
Другим примером является механизм машинного обучения, который принимает информацию о работе и зарплате и выдает результаты. Если этот набор данных не будет проанализирован, машина усилит смещение. Если он воспринимает, что мужчины занимают большинство руководящих должностей, а процесс машинного обучения включает в себя фильтрацию необработанных данных и выдачу соответствующих результатов, он возвращает результаты, отражающие предвзятость мужчин.
Вторая часть вопроса связана с тем, почему этот уклон настолько вреден. Без надлежащего контроля и тестирования новые технологии могут навредить, а не помочь нашему чувству интеграции и равенства. Если будет выпущен новый технический продукт, который распознает лица с более светлой кожей, но не с более темной кожей, это может привести к обострению этнической напряженности и ощущению, что рассматриваемая компания не чувствительна к разнообразию. Если алгоритм машинного обучения воспроизводит и усиливает систематическую ошибку в наборах данных, этот искусственный интеллект будет добавлять свой голос к человеческим голосам и человеческим тенденциям, которые уже существуют в социальной системе и которые благоприятствуют одной группе людей над другой.
Лучший способ справиться с этим - внимательно изучить базовые наборы данных, использовать выбор функций, добавить переменные входные данные и самим манипулировать наборами необработанных данных, а также увеличить реальную мощь машинного обучения за счет преднамеренного создания данных человеком, чтобы получить результат, который обеспечивает большую аналитическую силу, а также некоторые из тех человеческих идей, которые компьютеры еще не могут воспроизвести.