Q:
Как концепция равновесия может помочь проектам машинного обучения?
A:В целом, равновесие будет информировать машинное обучение, стремясь стабилизировать среду машинного обучения и создавать результаты с совместимым сочетанием детерминированных и вероятностных компонентов.
Эксперты описывают «равновесие» как ситуацию, когда рациональные участники в системе машинного обучения достигают консенсуса по стратегическим действиям - в частности, в равновесии по Нэшу в теории игр участвуют два или более из этих рациональных субъектов, объединяющих стратегии, признавая, что ни один из игроков не получает выгоды от изменение конкретной стратегии, если другие игроки не меняют свою.
Скачать бесплатно: машинное обучение и почему это важно |
Особенно популярная и простая демонстрация равновесия Нэша включает в себя простую матрицу, в которой два игрока выбирают двоичный результат.
Вышесказанное является довольно техническим способом описания равновесия и того, как оно работает. Гораздо более неформальный способ проиллюстрировать концепцию равновесия, в частности приведенный выше пример двух рациональных действующих лиц, каждый из которых имеет бинарный выбор, - это подумать о том, что вы могли бы назвать сценарием «идти навстречу друг другу в коридоре средней школы».
Предположим, два человека идут в разных направлениях по коридору средней школы (или любому другому типу помещений), в котором есть место только для двух человек по ширине. Два открытых пути - это двоичные результаты. Если два рациональных актера выбирают разные бинарные результаты, которые не конфликтуют друг с другом, они будут проходить мимо друг друга и говорить привет. Если они выбирают два противоречивых двоичных результата - они идут в одном и том же месте, и один из них должен будет уступить.
В приведенном выше примере, если два рациональных субъекта выбирают два совместимых и не противоречащих друг другу результата, общий консенсус заключается в том, что ни один из них не выиграет, изменив свою стратегию - в данном случае их направления ходьбы - если другой человек не изменит их.
Вышеизложенное составляет равновесие, которое можно смоделировать в любой данной конструкции машинного обучения. Принимая во внимание этот простой пример, в результате всегда будут сотрудничать два рациональных актера или, другими словами, два человека, идущие друг за другом.
Противоположное можно назвать «дисбалансом» - если два рациональных актера выберут противоречивые результаты, как уже упоминалось, один из них должен будет дать результат. Тем не менее, программа ML, моделирующая это, может быть брошена в бесконечный цикл, если оба решат уступить - очень похоже на то, как два человека двигаются, пытаясь приспособиться друг к другу и все еще продолжать идти к столкновению.
Равновесия, подобные приведенному выше, обычно используются в машинном обучении для создания консенсуса и стабилизации моделей. Инженеры и разработчики будут искать те сценарии и ситуации, которые выигрывают от равновесий, и работать, чтобы изменить или справиться с теми, которые этого не делают. Глядя на примеры из реальной жизни, которые соответствуют ML-равновесиям, легко увидеть, как этот вид анализа в системе машинного обучения является уникальным поучительным для выяснения того, как моделировать поведение человека путем создания рациональных действующих лиц и агентов. Это всего лишь один прекрасный пример того, как можно использовать равновесие для достижения прогресса в применении систем машинного обучения.