Q:
Почему некоторые проекты машинного обучения требуют огромного количества участников?
A:Когда вы думаете о машинном обучении, вы склоняетесь к опытным ученым, работающим с клавиатурой в компьютерных классах. Особое внимание уделяется количественному анализу и алгоритмам. Для многих из этих программ не так много непосредственного реального контекста - по крайней мере, так думают многие.
Тем не менее, некоторые из самых современных программ машинного обучения используют настоящие армии людей-актеров на улице, в магазинах и в любом другом месте, где они могут моделировать основные виды человеческой деятельности, такие как ходьба, работа или покупки.
Скачать бесплатно: машинное обучение и почему это важно |
Статья Тома Симонита в Wired очень хорошо иллюстрирует это под удачным названием «Чтобы искусственный интеллект стал умнее, люди выполняют странные низкооплачиваемые задачи».
На примере коротких видеороликов, снятых в продуктовом магазине Whole Foods, Simonite рассказывает о видах работы, которые помогут выполнить некоторые этапы машинного обучения.
Это приводит к вопросу о том, почему все эти люди занимаются съемкой коротких и простых видеороликов, документирующих такие рудиментарные действия, как движение рукой или ногой.
Ответ проливает некоторый свет на то, где находится машинное обучение и куда оно идет.
«Исследователи и предприниматели хотят, чтобы ИИ понимал и действовал в физическом мире», - пишет Симонит, объясняя, почему он и другие бродят по камерам. «Отсюда необходимость для рабочих разыгрывать сцены в супермаркетах и домах. Они создают учебный материал для обучения алгоритмам о мире и людях в нем ».
Как отмечают многие эксперты, некоторые из самых больших границ машинного обучения включают обработку изображений и обработку естественного языка. Это чрезвычайно количественные процедуры - иными словами, не существует широкого спектра входных данных, как в «эффективных» реальных условиях. Вместо этого программы машинного обучения используют визуальные и аудиоданные очень специфическими способами для построения моделей. При обработке изображений он выбирает элементы из (конечного) поля зрения. Для НЛП это сборка фонем.
Выход за пределы этих конкретных категорий ввода включает в себя то, что вы могли бы назвать «разрыв изображения и речи» - выходя за рамки таких вещей, как обработка изображений и распознавание речи, вы переходите в области, где компьютеры должны быть аналитическими по-разному. Учебные наборы будут принципиально иными.
Войдите в армию видеооператоров. В некоторых из этих новых проектов машинного обучения самые маленькие идеи человеческой деятельности - это учебные наборы. Вместо того, чтобы учиться искать элементы, края и пиксели, которые входят в задачи классификации, компьютеры вместо этого используют обучающие видео для оценки того, как выглядят различные типы действий.
Ключевым моментом является то, что инженеры могут делать с этими данными, когда они агрегируются и загружаются, и когда компьютер обучается им. Вы скоро увидите результаты в различных областях - например, это сделает наблюдение чрезвычайно эффективным. Компьютеры смогут «видеть» в поле зрения то, что делают люди, и применять это в таких областях, как маркетинг и продажи, или, возможно, в некоторых случаях, работа государственных органов или уголовное правосудие.
Последствия также проливают свет на дебаты между вопросами максимальной выгоды и конфиденциальности. Большая часть использования этих видеороликов будет создавать модели машинного обучения, которые будут работать для наблюдения - но как насчет людей, которые не хотят, чтобы их обследовали? Когда эти новые программы машинного обучения развернуты в публичном пространстве, каковы права человека и где эта черта проведена?
В любом случае, компании используют эти виды человеческих и видео-ресурсов, чтобы действительно углубиться в некоторые этапы машинного обучения следующего уровня, которые фактически позволят компьютерам распознавать, что происходит вокруг них, а не просто классифицировать изображения или работать с фонемами речь. Это чрезвычайно интересное и противоречивое развитие в области искусственного интеллекта, которое заслуживает своей доли внимания в технических средствах массовой информации и за ее пределами.