Q:
Что означают большие данные для официальной статистики?
A:Вопрос о том, как большие данные могут изменить официальную статистику и исследования федеральных или правительственных учреждений, является интересным, частично из-за характера современных систем сбора и сбора данных.
В некотором смысле большие данные конкурируют с другими традиционными методами сбора информации. Например, широко агрегированные данные из Интернета могут быть более точным предиктором, чем то, что создается «сообществом экспертов» в данной отрасли. Это означает, что большие данные могут подтолкнуть различные типы официальной статистики к более точным прогнозам или более эффективной методологии.
Другой способ, которым данные могут изменить официальную статистику, состоит в том, что будущие методы исследования могут интегрировать решения для больших данных, чтобы извлечь выгоду из этого компонента исследовательской работы. Например, Бюро переписей США проводит множество физических аудиторских проверок людей, зданий и инфраструктуры на территории США, основывая свою статистику на наблюдениях и ответах в режиме реального времени. Встраивание больших данных в работу Бюро переписей США может означать объединение интернет-данных об этих же системах и сравнение их с тем, что рабочие находят на местах. Существует множество способов интеграции больших данных и полевых исследований, которые определят конкретные результаты для любого вида экономического, социального или отраслевого исследовательского проекта.
Короче говоря, большие данные превратят официальную статистику в более современную и изощренную форму отчетности, в которой тщательные физические табулирования улучшаются за счет технических моделей и алгоритмов, которые работают на основе усреднения или прогнозирования из огромных объемов добываемых или собираемых данных. Это только одна из причин того, что огромные объемы больших данных, собираемых правительствами и предприятиями, настолько ценны и тщательно охраняются.