Почему смещение машины является проблемой в машинном обучении?

2025

На этот вопрос можно ответить двумя различными способами. Во-первых, почему проблема смещения машины, а именно, почему она существует в процессах машинного обучения?

Машинное обучение, хотя и сложное и сложное, в некоторой степени ограничено основанными на наборах данных, которые оно использует. Построение наборов данных включает в себя смещение. Точно так же, как в средствах массовой информации, где упущения и преднамеренный выбор включения могут демонстрировать конкретную предвзятость, в машинном обучении необходимо использовать наборы данных, чтобы определить, какой тип предвзятости существует.

Скачать бесплатно: машинное обучение и почему это важно

Например, для технологических испытаний и процессов проектирования характерна проблема показать предпочтение одного типа пользователя другому. Одним из ярких примеров является гендерное неравенство в мире технологий.

Почему это имеет значение, и почему это относится к машинному обучению?

Поскольку отсутствие существующих женщин в среде тестирования может привести к созданию технологии, которая будет менее удобной для женской аудитории. Некоторые эксперты описывают это так, что без существующего женского тестирования конечный продукт может не распознавать вклад женщин-пользователей - у него могут не быть инструментов для распознавания женской идентичности или для адекватного реагирования на вклад женщин.

То же самое относится к разным этническим группам, людям разных религий или любому другому типу демографии. Без правильных данных алгоритмы машинного обучения не будут работать правильно для данного пользовательского набора, поэтому данные включения должны быть преднамеренно добавлены в технологию. Вместо того, чтобы просто брать первичные наборы данных и усиливать пристрастное предубеждение, люди-обработчики должны по-настоящему взглянуть на проблему.

Другим примером является механизм машинного обучения, который принимает информацию о работе и зарплате и выдает результаты. Если этот набор данных не будет проанализирован, машина усилит смещение. Если он воспринимает, что мужчины занимают большинство руководящих должностей, а процесс машинного обучения включает в себя фильтрацию необработанных данных и выдачу соответствующих результатов, он возвращает результаты, отражающие предвзятость мужчин.

Вторая часть вопроса связана с тем, почему этот уклон настолько вреден. Без надлежащего контроля и тестирования новые технологии могут навредить, а не помочь нашему чувству интеграции и равенства. Если будет выпущен новый технический продукт, который распознает лица с более светлой кожей, но не с более темной кожей, это может привести к обострению этнической напряженности и ощущению, что рассматриваемая компания не чувствительна к разнообразию. Если алгоритм машинного обучения воспроизводит и усиливает систематическую ошибку в наборах данных, этот искусственный интеллект будет добавлять свой голос к человеческим голосам и человеческим тенденциям, которые уже существуют в социальной системе и которые благоприятствуют одной группе людей над другой.

Лучший способ справиться с этим - внимательно изучить базовые наборы данных, использовать выбор функций, добавить переменные входные данные и самим манипулировать наборами необработанных данных, а также увеличить реальную мощь машинного обучения за счет преднамеренного создания данных человеком, чтобы получить результат, который обеспечивает большую аналитическую силу, а также некоторые из тех человеческих идей, которые компьютеры еще не могут воспроизвести.

Почему смещение машины является проблемой в машинном обучении?

Почему мешки в машинном обучении уменьшают дисперсию?

Какой простой способ описать смещение и дисперсию в машинном обучении?

Почему путаница полезна в машинном обучении?

Выбор редактора

Что такое саблы? - определение из техопедии

Что такое bootcfg? - определение из техопедии

Что такое powermat? - определение из техопедии

Что такое сила прикосновения? - определение из техопедии

Выбор редактора

Что такое технодетерминизм? - определение из техопедии

Что такое семантический репозиторий? - определение из техопедии

Что такое предприятие в реальном времени? - определение из техопедии

Что такое теория ограничений (toc)? - определение из техопедии

Выбор редактора

Что такое аппаратное обеспечение vpn? - определение из техопедии

Что такое 3ivx? - определение из техопедии

Что такое облако ВПН? - определение из техопедии

Что такое pptp vpn? - определение из техопедии

Выбор редактора

Что такое рутинг? - определение из техопедии

Что такое совместный сайт? - определение из техопедии

Что такое закон Годвина? - определение из техопедии

Что такое клик-приманка? - определение из техопедии

Выбор редактора

Что такое спутниковая широкополосная связь? - определение из техопедии

Что такое rsync? - определение из техопедии

Что такое ртутный загрузчик? - определение из техопедии

Что такое биометрический двигатель? - определение из техопедии

Популярные категории