Дом Базы данных Использование алгоритмов для прогнозирования выборов: чат с Дрю Линзером

Использование алгоритмов для прогнозирования выборов: чат с Дрю Линзером

Anonim

Дрю будет выступать на Саммите по инновациям в области больших данных, который пройдет 30 и 31 января в Лас-Вегасе: http://analytics.theiegroup.com/bigdata-lasvegas, наряду с докладчиками из Обамы для Америки, Best Buy, LinkedIn, The New York Times, Nokia, Bitly, Barnes & Nobles, Walmart Labs и многие другие.


Ссылка для регистрации: http://bit.ly/Zs3wms


Это интервью было проведено Джорджем Хиллом и опубликовано в журнале Big Data Innovation Magazine.


Какая реакция была на ваши прогнозы?


Большая часть реакции была сосредоточена на разнице в точности между теми из нас, кто изучал опросы общественного мнения, и прогнозами «интуиции» популярных ученых и комментаторов. В день выборов такие аналитики, как я, Нейт Сильвер (блог New York Times FiveThirtyEight), Саймон Джекман (Стэнфордский университет и Huffington Post) и Сэм Ванг (Консорциум по выборам в Принстоне) оценили вероятность переизбрания Обамы на уровне более 90% и правильно предвидели 332 голоса избирателей за Обаму как наиболее вероятный результат. Тем временем такие эксперты, как Карл Роув, Джордж Уилл и Стив Форбс, говорили, что Ромни собирается победить - а в некоторых случаях легко. Это привело к разговорам о «победе для квантов», которые, я надеюсь, перенесут на будущие выборы.


Как вы оцениваете алгоритм, используемый в ваших прогнозах?


Моя модель прогнозирования оценивала результаты голосования штата и итоговое голосование на выборах каждый день кампании, начиная с июня. Я хотел, чтобы оценка этих прогнозов была максимально справедливой и объективной - и не оставляла мне места для маневра, если они ошибались. Итак, примерно за месяц до выборов я разместил на своем веб-сайте набор из восьми критериев оценки, которые я буду использовать, когда станут известны результаты. Как оказалось, модель работала отлично. Летом он предсказывал, что Обама выиграет все свои штаты 2008 года, за исключением Индианы и Северной Каролины, и почти не изменил этого прогноза даже после того, как поддержка Обамы в сентябре выросла, а затем упала после первых президентских дебатов.


Объем данных, используемых в ходе этой кампании как независимыми аналитиками, так и командами кампаний, был огромен, какое значение это имеет для использования данных в 2016 году?


Кампания 2012 года подтвердила, что множеством разнообразных источников количественной информации можно управлять, доверять и успешно применять их для самых разных целей. Мы, посторонние, смогли заранее предсказать исход выборов. В ходе кампаний были достигнуты огромные успехи в адресной кампании избирателей, отслеживании мнений, сборе средств и явке избирателей. Теперь, когда мы знаем, что эти методы могут работать, я думаю, что пути назад нет. Я ожидаю, что репортеры и комментаторы кампании будут более серьезно относиться к агрегированию опросов в 2016 году. И хотя Обама и демократы в настоящее время, похоже, обладают преимуществом в технологии кампании, я был бы удивлен, если бы республиканцы не смогли быстро догнать их.


Считаете ли вы, что успех этой кампании, основанной на данных, привел к тому, что менеджеры кампаний теперь должны быть как аналитиками, так и стратегами?


Менеджеры кампаний, возможно, сами не должны быть аналитиками, но они должны лучше понимать, как данные и технологии могут быть использованы в их интересах. В кампаниях всегда использовались опросы, чтобы сформулировать стратегию и измерить настроения избирателей. Но теперь есть целый ряд других мощных инструментов: веб-сайты социальных сетей, базы данных избирателей, мобильные смартфоны и электронный маркетинг, и это лишь некоторые из них. И это в дополнение к недавним достижениям в методологиях опроса и статистическом моделировании мнений. Сейчас в американской предвыборной политике происходит много инноваций.


Вам удалось предсказать результаты выборов за 6 месяцев, как вы думаете, каковы реалистичные максимальные сроки, чтобы точно предсказать результат, используя ваши методы аналитики?


Около четырех или пяти месяцев - это уже так далеко, как наука позволяет нам идти прямо сейчас; и это даже немного подталкивает. До этого опросы не были достаточно информативными о возможном результате: слишком много людей либо не определились, либо не начали обращать внимание на кампанию. Исторические экономические и политические факторы, которые, как было показано, коррелируют с результатами выборов, также начинают терять свою прогностическую силу, как только мы выйдем за пределы примерно 4-5 месяцев. К счастью, это все еще дает кампаниям достаточно времени для разработки стратегии и принятия решений о том, как распределять свои ресурсы.

Использование алгоритмов для прогнозирования выборов: чат с Дрю Линзером