Дом аудио Внедрить аналитику повсюду: учёные-исследователи

Внедрить аналитику повсюду: учёные-исследователи

Anonim

Персоналом Техопедии, 25 августа 2016 г.

Вывод: Ведущая Ребекка Джозвиак обсуждает феномен встраиваемой аналитики и ученых, работающих с гражданскими данными, с доктором Робином Блором, Дезом Бланчфилдом и Дэвидом Суэнхором.

Вы должны зарегистрироваться для этого события, чтобы просмотреть видео. Зарегистрируйтесь, чтобы посмотреть видео.

Ребекка Йозвиак: Дамы и господа, привет и добро пожаловать в Hot Technologies. «Внедрить везде: включение Citizen Data Scientist» - наша тема сегодня. Я заменяю твоего обычного хозяина, это - Ребекка Джозвиак, заменяющая Эрика Каванага. Да, в этом году жарко. В частности, термину «ученый данных» уделяется много внимания, хотя мы привыкли называть их скучными именами, такими как «статистика» или «эксперт по аналитике», в значительной степени касаясь тех же видов деятельности, но у него есть новое сексуальное имя, и это собирая много внимания. Их очень желательно иметь на рабочем месте, выгодно для организации, и каждый хочет одного. Но они: 1) дорогие, 2) трудно найти. Вы знаете, это было во всех новостях о нехватке навыков ученого данных, да, но тем не менее они предлагают огромную ценность для организации, и люди вроде как требуют выяснить, как получить это значение, не отбрасывая ни копейки, чтобы разговаривать.

Но хорошая новость в том, что мы видим выход инструментов и программного обеспечения, которые отчасти компенсируют этот дефицит. У нас есть автоматизация, машинное обучение, встроенная аналитика - вот о чем мы будем изучать сегодня, и это как бы породило новый термин «ученый данных граждан», и что это значит? Нет, это не ваш обученный специалист по данным, это может быть ваш бизнес-пользователь, ваш эксперт по бизнес-аналитике, кто-то из ИТ, кто-то, у кого есть опыт, но, возможно, не обязательно опыт. Но то, что он делает, эти инструменты и программное обеспечение, это то, что он дает больше людей доступ к этим умным решениям, даже если они не знают глубокого кодирования. Но это просто помогает повысить производительность в целом, когда вы даете всем чуть больше доступа к этой аналитической мысли. Вам не обязательно проходить обучение, чтобы иметь любопытство, которое может привести к хорошим представлениям о вашей компании.

Обсуждая, что сегодня с нами работает наш собственный Робин Блур, главный аналитик Bloor Group, сам один из неуловимых ученых-данных, звонит Дез Бланчфилд, а затем у нас будет презентация Дэвида Суинора из Dell Statistica сегодня. И с этим я собираюсь передать это Робин Блур.

Робин Бур: Хорошо, спасибо за это вступление. Я вроде думал об этом в историческом контексте. Здесь мы на самом деле рассматриваем один из проектов Леонардо да Винчи для своего рода планера, который человек может надеть на спину. Я понятия не имею, будет ли это на самом деле работать. Я бы не стал вдаваться в это, я должен сказать. Тем не менее, да Винчи, когда я думаю о да Винчи, я думаю о нем как об одном из самых любознательных и аналитических людей, которые когда-либо существовали. И совершенно ясно, если вы просто посмотрите на этот планер, который спроектирован на основе птичьего крыла, и он так или иначе изучил полеты птиц, чтобы построить его.

Если мы возьмем историческую перспективу - я на самом деле посмотрел на это - аналитика, возможно, является самым старым применением математики. Есть переписи, которые относятся, по крайней мере, к вавилонским временам. Мы знаем об этом, потому что в основном есть клинописные таблички с такими данными. Не известно, было ли что-нибудь, что вернулось раньше. Но очевидно, что у вас есть цивилизация с большим количеством людей, на самом деле это требует планирования, и стоит знать, что вы планируете и каковы требования этих людей на самом деле.

И именно там это началось, и именно там начались вычисления, потому что первые компьютеры, первые механические компьютеры, на самом деле были, я думаю, первой была перепись, созданная Холлеритом, который, как я полагаю, стал IBM. Все это продвинулось вперед. Между 1970-ми и сегодняшним днем ​​была некоторая интерлюдия, когда огромное количество других приложений и аналитики, можно сказать, отошли на второй план. Да, аналитика продолжалась - это происходило в крупных организациях, особенно в банках и страховых компаниях, на самом деле в General Electric, телекоммуникационных компаниях и подобных вещах, - но в целом это не использовалось в бизнесе, и теперь оно начинает использоваться в целом повсеместно. бизнес. И это действительно изменило игру. Первое, на что я хотел обратить внимание - это пирамида данных, которая мне особенно нравится. Это, я имею в виду, я нарисовал один из этих 20 лет назад - по крайней мере 20 лет назад - чтобы попытаться понять, на самом деле, в то время, я пытался понять BI и некоторые ранние исследования данных, которые были сделаны. Здесь я определил идею данных, а примерами являются сигналы, измерения, записи, события, транзакции, расчеты, агрегации, отдельные точки информации. Вы можете думать о них как о молекулах информации, но это отдельные точки. Это становится информацией, как только она получает контекст. Связанные данные, структурированные данные, базы данных, визуализация данных, плоттеры, планировщики и онтологии - все они, на мой взгляд, считаются информацией, потому что то, что вы сделали, - это объединение большого разнообразия воедино и создание чего-то гораздо большего, чем точка данных, что-то, что на самом деле имеет форму, математическую форму.

Над этим у нас есть знания. Изучив информацию, мы можем узнать, что существуют различные шаблоны, и мы можем использовать эти шаблоны, формулируя правила, политики, руководящие принципы, процедуры, а затем они приобретают форму знаний. И почти все компьютерные программы, что бы они ни делали, являются своего рода знаниями, потому что они работают против данных и применяют к ним правила. У нас есть эти три слоя, и между слоями происходит все большее уточнение. А в левой части этой диаграммы вы видите ввод новых данных, поэтому многие из них статичны. Данные накапливаются, информация накапливается и знания потенциально растут. На вершине у нас есть «Понимание», и я бы сказал, хотя это философский аргумент, что понимание существует только в людях. Если я ошибаюсь, тогда мы все будем заменены компьютерами в какой-то момент времени. Но вместо того, чтобы спорить, я перейду к следующему слайду.

Когда я посмотрел на это, что-то интересное, это что-то недавнее, интересно было попытаться выяснить, чем на самом деле была аналитика. И в конечном итоге, нарисовав различные диаграммы и получив в итоге такую ​​диаграмму, я пришел к выводу, что на самом деле разработка аналитики - это на самом деле просто разработка программного обеспечения с огромным количеством математических формул. Аналитическое исследование немного отличается от разработки программного обеспечения в том смысле, что вы на самом деле берете много разных моделей и исследуете их, чтобы получить новые знания о данных. Но как только вы сгенерируете его, он будет реализован либо как то, что я считаю пассивной поддержкой принятия решений, то есть информацией, просто поступающей пользователю; интерактивная поддержка принятия решений, например OLAP, когда пользователю предоставляется структурированный набор данных, который он может исследовать и самостоятельно определять, используя различные доступные инструменты. Так много визуализаций. И тогда у нас есть автоматизация, если вы можете просто превратить собранную вами аналитическую информацию в набор правил, которые могут быть реализованы, вам необязательно быть вовлеченным человеком. Вот как я смотрел на это, когда делал все это. И разные вещи начали происходить со мной. Скажем, однажды сфера деятельности, когда область данных действительно добывается, тщательно разрабатывается, тщательно исследуется во всех возможных направлениях, в конечном итоге она просто кристаллизуется. Изобретенное знание начинает становиться знанием, которое информирует различных пользователей различными способами и повышает их способность, мы надеемся, фактически выполнять работу, которую они делают.

Одна из вещей, которые я заметил, и я смотрел на прогнозную аналитику около пяти лет, но прогнозирующая аналитика становится BI, в том смысле, что она просто превращается в полезную информацию для передачи людям, и, как я уже указывал, Есть автоматизированная отчетность по BI, BI-исследование, BI, очень разные ее градации и прогнозирующая аналитика на самом деле во всех трех направлениях. И аналитический процесс, как я уже отмечал, ничем не отличается от разработки программного обеспечения, просто выполняется разными людьми с немного разными навыками. Полагаю, я должен подчеркнуть, что умения, необходимые для создания действительно хорошего ученого, занимают годы. Их нелегко приобрести, и не так уж много людей могут это сделать, но это потому, что это требует понимания математики на очень сложном уровне, чтобы знать, что правильно, а что нет. Аналитические разработки, открытие новых знаний, внедрение аналитики, это вопрос о том, как сделать знания оперативными. Это тот вид фона, который я вижу для всей аналитики. Это огромная территория, и в ней много-много измерений, но я думаю, что обобщение применимо ко всему.

Затем происходит срыв бизнеса, как я уже упоминал, есть ряд организаций, фармацевтические компании - это еще одна организация, в основе которой лежит аналитика. Но есть много организаций, у которых действительно нет этого в их ДНК, и теперь у них есть способность, теперь программное обеспечение и аппаратные средства намного более дешевы, чем это было раньше, теперь у них есть возможность использовать это. Я бы сказал несколько вещей. Во-первых, аналитика во многих случаях - это исследования и разработки. Возможно, вы просто применяете аналитику в определенной области организации, и может показаться обыденным, что вы тем или иным образом анализируете заказы клиентов еще раз с разных точек зрения, объединяя их с другими данными. Но аналитика фактически дает возможность взглянуть на организацию в целом и в значительной степени проанализировать любую конкретную деятельность, которая происходит внутри организации и целых цепочек деятельности. Но как только вы действительно перейдете в эту область, я бы сказал, что это исследования и разработки. И есть вопрос, который мне задавали пару раз, а именно: «Сколько компания должна потратить на аналитику?». И я думаю, что лучший способ подумать о предоставлении ответа на это - думать о аналитике как о НИОКР. и просто спросите: «Сколько бы вы потратили на исследования и разработки в области эффективности бизнеса?»

И компании, которые не имеют аналитики, есть много вещей, которые они не знают. Прежде всего, они не знают, как это сделать. Обычно, если они на самом деле собираются так или иначе принять аналитику в организации - у них действительно практически нет другого выбора, кроме как обратиться к консультанту, который может помочь им в этом, потому что это было бы невозможно или действительно очень трудно для большинства предприятиям нужно нанять исследователя данных, найти его, заплатить за него и действительно доверить им делать то, что вы от них хотите. Очень сложно. Большинство предприятий не знают, как нанять или обучить персонал, чтобы фактически выполнять эту работу, и причина этого в том, что это просто не входит в их ДНК, поэтому это не является частью их естественных бизнес-процессов. Это коренится в следующем пункте. Они не знают, как сделать это бизнес-процессом. Кстати, лучший способ сделать это - скопировать то, что фармацевтические компании и страховые компании, просто посмотрите, и некоторые компании в медицинском центре, просто посмотреть, как они используют аналитику, и скопировать ее. Потому что это бизнес-процесс. Не знаю, как это контролировать или проверять. Это действительно, особенно сейчас, когда огромное количество компаний-разработчиков создали продукты, которые автоматизируют огромное количество аналитики. Вопрос об аудите важен, когда у вас есть консультант или кто-то, кому можно доверять, чтобы понять, каковы результаты любого аналитического расчета, это своего рода выбор, который вы должны сделать, но если вы положите действительно мощные аналитические инструменты в руки людей, которые не понимают аналитику должным образом, они, скорее всего, сделают неверные выводы. И, как я уже сказал, компании не знают, как на это рассчитывать.

Это разновидности аналитики, я просто пробежусь по ним. Статистическая аналитика и статистическое моделирование значительно отличаются от прогнозирующей аналитики, большинство из которых, кстати, соответствует кривой. Машинное обучение отличается от тех вещей, аналитика пути и временные ряды, которые в основном выполняются в потоках статуса, снова отличаются. Графическая аналитика снова отличается, и текстовая аналитика и семантическая аналитика снова отличаются. Это просто указывает на то, что это очень многожанровая вещь. Это не так, вы не начинаете заниматься аналитикой, вы начинаете смотреть на проблемы, которые у вас есть, и искать различные инструменты и различные варианты аналитики, которые подойдут для них. И, наконец, чистая сеть. Из-за эволюции аппаратного и программного обеспечения, на мой взгляд, аналитика находится в зачаточном состоянии. Еще многое, многое еще впереди, и мы увидим, как это развернется в ближайшие годы. Я думаю, что теперь могу передать мяч Дезу.

Дез Бланчфилд: Да, поговори о трудном поступке, Робин. Я собираюсь кратко посетить эту тему с одного из моих любимых ракурсов, а именно с точки зрения человека. В нашей повседневной жизни происходит так много изменений. На мой взгляд, одно из самых больших нарушений в нашей повседневной жизни - это просто повседневная работа. Приступая к работе и пытаясь выполнить работу, которую вы наняли, и увеличивая ожидания того, что вы собираетесь перейти от обычного человека к супергерою, и количество информации, которая течет по организациям и излучает очень, очень быстро, это серьезная задача, и все больше и больше мы должны предоставлять людям лучшие и лучшие инструменты, чтобы попытаться справиться с потоком знаний и информации, и поэтому я подумал, что постараюсь прийти к этому с некоторой забавной стороны, Но меня всегда поражает то, как у нас есть этот высокий ум или флешмобы и так далее, которые как бы подталкивают нас к тому, о чем мы говорим как аналитику, но на самом деле то, о чем мы говорим, - это сделать информацию доступной для людей, и позволяя им взаимодействовать с ним и делать это таким образом, чтобы это было естественно и казалось нормальным.

И на самом деле, это напоминает мне видео на YouTube о маленьком ребенке, маленьком ребенке, сидящем на полу и сидящем там, играющем с iPad, который крутится, сжимает, сжимает и выдвигает изображения и играет с экраном, данные там. А потом родитель забирает iPad и кладет журнал, печатный журнал на колени ребенка. И этому ребенку, вероятно, не более двух лет. Ребенок начинает пытаться смахивать с экрана журнала, и ущипнуть и сжать, и журнал не отвечает. Ребенок поднимает палец вверх, смотрит на него и думает: «Хм, я не думаю, что мой палец работает», и он тыкает себе в руку и думает: «Нет, мой палец работает, я чувствую свою руку и выглядит хорошо », и он изгибает палец, а палец извивается и отвечает. Да. Затем он снова пытается взаимодействовать с журналом, и вот он не сжимает, не сжимает и не прокручивает. Затем они забирают журнал и кладут iPad обратно на колени, и вдруг все работает. Итак, вот ребенок, который пришел и научился использовать аналитический инструмент или инструмент для потокового вещания для развлечения, и он не может понять, как должен работать журнал и как переворачивать страницы.

И это интересная концепция сама по себе. Но когда я думаю о знаниях, распространяющихся по организациям, о потоках данных и о том, как ведут себя люди, я часто думаю об этой концепции того, что люди узнали как флешмоб, где происходит событие и какие социальные сети делают это даже легче сделать, идея как таковая, которая идет в это место в это время и дату и действие, или видео и изучает эти танцы, или носит эту цветную шляпу и указывает на север в час. И вы проталкиваете это через свою сеть, и неизменно целая масса людей, сотни из них, оказываются в одном и том же месте в одно и то же время, делают одно и то же, и есть такой вау-фактор, такой как «Святая корова, которая была действительно впечатляет! »Но на самом деле это действительно простая идея, и простая концепция, которую просто распространяют через наши сети, и мы получаем этот результат, который является визуально ошеломляющим и впечатляющим по звучанию. И когда вы думаете об организации, о том, как мы хотим, чтобы люди вели себя, и о том, как мы хотим, чтобы они общались с информационными системами и клиентами, зачастую это так просто, это идея, концепция, культурная или поведенческая черта, которую мы пытаемся передать через и расширить возможности с помощью инструментов и информации.

И подкрепляя все это мантрой, которая была у меня более двух с половиной десятилетий, а именно: если ваши сотрудники не могут найти то, что им нужно для выполнения своей работы, будь то инструменты или информация, они неизменно будут изобретать велосипед. И вот теперь это становится все более сложной задачей, когда у нас много знаний, много информации и все происходит очень быстро, и мы хотим, чтобы люди не изобретали велосипед заново. И когда мы думаем о нашей рабочей среде, возвращаясь к ракурсу людей, который является одним из моих любимых, я был поражен, когда мы были удивлены, что кабинки не были благоприятной средой для хороших результатов, или мы выстроили такие вещи, как это ужасно фотографии здесь, и это не сильно изменилось, просто опустил стены и назвал их открытыми рабочими местами. Но посередине с желтой петлей вокруг них два человека обмениваются знаниями. И все же, если вы посмотрите на оставшуюся часть комнаты, все они там послушно стучат, выкладывая информацию на экран. И чаще всего, на самом деле не обмениваются знаниями и данными, и этому есть целый ряд причин. Но взаимодействие в середине этажа слева там, в желтом круге, там два человека болтают там, обмениваются знаниями и, вероятно, пытаются что-то найти, пытаясь сказать: «Вы знаете, где находится этот отчет, где я могу найти эти данные, какой инструмент я использую, чтобы сделать это? »И это, вероятно, не сработало, поэтому у них ничего нет, и они бродили по полу, нарушили правила офисного помещения в кабинке и сделали это лично.

И у нас в офисе была похожая обстановка, над которой мы в шутку подшучивали, но реальность такова, что они достаточно мощные и эффективные. И одна из моих любимых - это мобильная или стационарная аналитическая платформа, называемая кулером для воды, где люди поднимаются туда, болтают там, обмениваются знаниями, сравнивают идеи и проводят аналитику, стоя у кулера, обмениваясь идеями. Это очень мощные концепции, когда вы думаете о них. И если вы сможете перевести их на свои системы и инструменты, вы получите потрясающий результат. И у нас есть фаворит на все времена, который по сути является самым мощным офисным центром распространения данных, иначе называемым стойкой регистрации. И если вы не можете найти что-то, куда вы идете? Ну, вы идете к передней части офиса и идете к стойке регистрации и говорите: «Вы знаете, где x, y, z?» И я осмелюсь сказать кому-нибудь, что они не делали этого хотя бы один раз в новом работу или в какой-то момент, когда они просто не могут что-то найти. И вы должны спросить себя, почему это так? Это должно быть где-то в интранете или каком-то инструменте или чем-то еще. Это должно быть легко найти.

И поэтому, когда речь заходит о данных и аналитике, а также о инструментах, которые мы предоставили нашим сотрудникам для выполнения своей работы, и о том, как люди взаимодействуют с работой, у меня сложилось мнение, что до недавнего появления инструментов аналитики и платформ больших данных или «обработка данных», а также, как это принято называть в старой школе, отчетность и обмен знаниями были далеко не динамичными, не совместными, а открытыми, и когда вы думаете о типе систем, с которыми мы ожидаем, что люди будут выполнять свою работу, у нас были классические, что сейчас люди называют наследие, но реальность такова, что это только наследие, которое продолжается, и оно все еще здесь сегодня, и, следовательно, это не совсем наследие. Но традиционные HR-системы и ERP-системы - управление персоналом, планирование ресурсов предприятия, управление данными предприятия и системы, которые мы используем для управления информацией для управления компанией. Это неизменно разрозненно. И на самом верху - простые платформы, такие как внутриведомственные отделы, которые пытаются сообщать, где что находится и как их получить, и как взаимодействовать со знаниями по всему миру. Мы добавили это в нашу интранет. Это так же хорошо, как люди, которые тратят время и усилия на то, чтобы поставить это, иначе это просто останется в вашей голове. Или у вас есть данные, которые находятся в самом конце пищевой цепочки, в корпоративных сетях хранения данных и между ними, так что сети хранения данных полны файлов и данных, но кто знает, где их найти.

Чаще всего мы создавали эти закрытые платформы данных или закрытые системы, и поэтому люди обращались к электронным таблицам и PowerPoints для передачи информации по всему месту. Но, на мой взгляд, недавно произошла интересная вещь, заключающаяся в том, что мобильные устройства и Интернет в целом работают таким образом, что на самом деле все может быть лучше. И преимущественно в потребительском пространстве. И это интересно, что в повседневной жизни у нас появились такие вещи, как интернет-банкинг. Нам не нужно было идти в физический банк, чтобы взаимодействовать с ними, мы могли сделать это по телефону. Первоначально это было неуклюже, но затем появился Интернет, и у нас был веб-сайт. Вы знаете, а сколько раз вы действительно были в вашем банке за последнее время? Я на самом деле не могу, у меня был разговор об этом на днях, и я на самом деле не могу вспомнить, когда в последний раз я ходил в свой банк, что меня очень потрясло, я думал, что смогу вспомнить это, но это было так долго назад я на самом деле не могу вспомнить, когда я пошел туда. Итак, теперь у нас в руках есть эти гаджеты в виде мобильных телефонов и телефонов, планшетов и ноутбуков, у нас есть сети и доступ к инструментам и системам, а в потребительском пространстве мы узнали, что все может быть лучше, но потому что из-за быстрых изменений в потребительском пространстве, которые были более летаргическими и ледяными изменениями внутри предприятия и в окружающей среде, мы не всегда принимали это изменение в повседневной трудовой жизни.

И я люблю подшучивать над тем фактом, что нельзя транслировать потоковые данные в печатном виде. На этом изображении здесь сидит человек, смотрящий на выполненную аналитику, и есть красивый график, составленный кем-то, кому, вероятно, платят большие деньги как статистик или актуарий, и они сидят там, пытаясь сделать аналитика по распечатке и ковырению в ней. Но вот для меня пугающая вещь: например, эти люди в этом конференц-зале, и я буду использовать это в качестве примера, они взаимодействуют с данными, которые теперь являются историческими. И с тех пор, как эта вещь была произведена, а затем напечатана, столько же лет, так что, возможно, это недельный отчет. Теперь они принимают решения не столько о плохих данных, сколько о старых данных, которые всегда могут быть плохими данными. Сегодня они принимают решение, основываясь на чем-то историческом, а это действительно плохое место. Нам удалось заменить эту печатную копию на подобные планшетам и телефонам, потому что мы очень быстро работали в потребительском пространстве, и теперь мы разработали ее в корпоративном пространстве, что понимание в реальном времени - это ценность в реальном времени.

И мы становимся все лучше и лучше в этом. И это подводит меня к тому, что Робин поднял ранее, - это концепция ученого-гражданина и основа этой концепции. Для меня гражданский специалист по данным - это просто обычные люди с правильными инструментами и информацией, подобной iPad. Им не нужно делать математику, им не нужно знать алгоритмы, им не нужно знать, как применять алгоритмы и данные правил, им просто нужно знать, как использовать интерфейс. И это возвращает меня к моему представлению и концепции малыша, сидящего там с iPad против журнала, против iPad. Малыш может очень быстро, интуитивно узнать, как использовать интерфейс iPad, чтобы погрузиться в информацию и взаимодействовать с ней, хотя это может быть игра или потоковое мультимедиа или видео. Но он не мог получить тот же отклик или взаимодействие от бара журнала и просто мигать страница за страницей, что не очень привлекательно, особенно если вы малыш, выросший на iPad. Неизменно люди могут очень быстро найти и научиться управлять инструментами и вещами, если мы просто предоставляем их, и если мы предоставляем им такой интерфейс, как мобильные устройства и, в частности, планшеты и смартфоны с достаточно большими экранами, и особенно, если вы можете взаимодействовать они на ощупь, с движениями пальцев, внезапно вы получаете это понятие гражданина данных ученого.

Кто-то, кто может применить науку о данных с правильными инструментами, но фактически не должен знать, как это сделать. И, на мой взгляд, многое из этого, как я уже сказал, было обусловлено влиянием потребителей, которое перешло и превратилось в спрос и предприятие. Пара действительно быстрых примеров. Мы, многие из нас, начали бы что-то делать с нашими блогами и веб-сайтами, например размещать небольшие рекламные объявления или смотреть на отслеживание и перемещение, мы использовали такие инструменты, как Google Analytics, и мы осознали тот факт, что в наших блогах и небольших веб-сайтах мы могли бы поместить туда небольшие кусочки кода, и Google предоставил бы нам в режиме реального времени понимание того, кто посещает веб-сайт, когда, где и как. И в реальном времени мы могли видеть, как люди заходят на сайт, просматривают страницы и затем исчезают. И это было довольно удивительно. Мне нравится все еще делать это, когда я пытаюсь объяснить аналитику в реальном времени людям, я просто тупо показываю им веб-сайт с подключенной Google Analytics, и на самом деле вижу живое взаимодействие с людьми, попадающими на веб-сайты, и спрашиваю их: «Представьте, что если у вас было такое понимание вашего бизнеса в режиме реального времени ».

Возьмите пример из розничной торговли, и, возможно, фармацевтический препарат, я думаю, вы называете его аптекой в ​​Америке, аптекой, в которую вы входите и покупаете все, от таблеток от головной боли до солнцезащитных кремов и шляп. Попытка управлять этой организацией без информации в режиме реального времени - страшная концепция, теперь мы знаем то, что знаем. Например, вы можете измерить пешеходный трафик, вы можете расположить устройства вокруг магазина с улыбающимся лицом на одной стороне экрана, потому что вы счастливы, а недовольный красный - справа, а некоторые другие оттенки - посередине. И в эти дни есть платформа под названием «Счастлив или нет», где вы заходите в магазин и можете порадовать себя счастливым или грустным лицом, в зависимости от того, как вы реагируете на настроение своих клиентов. И это может быть интерактивным в режиме реального времени. Вы можете получить живые цены на основе спроса. Если там много людей, вы можете немного поднять цены, и вы можете сделать наличие на складе и сказать людям, например - авиакомпании, например, сообщат людям, сколько мест сейчас доступно на сайте, когда вы Если вы бронируете рейс, вы не просто случайно набираете номер и надеетесь, что сможете приехать и получить билет. Живые данные HR, вы можете сказать, когда люди включаются и выключаются. Закупки, если вы осуществляете закупки и у вас есть оперативные данные, вы могли бы сделать такие вещи, как ожидание в течение часа и хеджирование по отношению к цене доллара США, чтобы купить ваш следующий груз и получить кучу вещей.

Когда я показываю людям Google Analytics и транслирую такой анекдот, этот момент эврики, этот момент «а-ха!», Эта лампочка гаснет у них в голове, как: «Хм, я вижу много мест, где я могу это сделать, Если бы у меня были инструменты, и если бы у меня был доступ к этим знаниям ». И мы видим это сейчас в социальных сетях. Любой, кто разбирается в соцсетях, кроме того, что просто показывает фотографии своего завтрака, имеет тенденцию смотреть, сколько лайков они получают, сколько трафика они получают и сколько друзей получают, и они делают это с помощью любит, скажем, Twitter как инструмент аналитики. Вы можете перейти на Twitter.com, чтобы использовать этот инструмент, но вы набираете в Google Twitter Analytics dot com или нажимаете на верхнюю правую кнопку, выпадаете меню и делаете это, вы получаете эти красивые, живые графики, которые говорят вам, сколько твиты вы делаете сами и сколько взаимодействует с ними. И аналитика в реальном времени только в ваших личных социальных сетях. Представьте себе, если бы у нас были такие, как Google Analytics и Facebook, LinkedIn и Twitter, статистика eBay будет доступна вам, но в вашей рабочей среде.

Теперь у нас есть живой вид сети и мобильных устройств, и это становится мощной концепцией. Таким образом, это подводит меня к моему выводу, и это то, что неизменно я обнаружил, что организации, которые рано и поздно используют инструменты и технологии, получают такое значительное преимущество перед своими конкурентами, что конкуренты могут фактически никогда не догнать. И мы видим это сейчас с конфликтом гражданских данных ученого. Если мы сможем взять людей с навыками, знаниями, к которым мы их наняли, и мы сможем дать им нужные инструменты, в частности, возможность видеть данные в реальном времени и находить данные, а также знать, где они находятся, не обходя кабины. и задавать вопросы вслух, приходить и стоять у кулера с водой, чтобы провести сравнительную аналитику с людьми, или пойти и спросить у администратора, где находится индекс. Если они могут сделать это у себя под рукой, и они могут взять это на свои встречи с ними и сидеть в зале заседаний, перелистывая экраны в режиме реального времени, а не в печатном виде, внезапно мы наделили наших сотрудников, которые не должны быть реальными учёные, но на самом деле использовать науку о данных и добиться потрясающих результатов для организаций. И я думаю, что этот переломный момент, который мы фактически преодолели, когда потребителя направляют на предприятие, проблема заключается в том, как мы обеспечиваем это предприятие, и я думаю, что это тема сегодняшнего обсуждения. И с этим я собираюсь завернуть свою часть и передать, чтобы услышать, как мы могли бы решить это. Дэвид, к тебе.

Дэвид Суинор: Хорошо, спасибо большое, ребята, и спасибо, Робин. Знаешь, Робин, я согласен с твоей первоначальной оценкой. Аналитический процесс, он ничем не отличается от разработки программного обеспечения. Я думаю, что проблема внутри организации просто действительно, вы знаете, может быть, вещи не так хорошо определены, возможно, есть исследовательский компонент, и творческий компонент к нему. И Дез, ты знаешь, я согласен с тобой, есть много изобретений колеса, и ты знаешь, нет организации, в которую я вступаю сегодня, ты спрашиваешь, ну, почему ты так делаешь? Почему бизнес работает именно так? И это легко подвергать сомнению, и во многих случаях, когда вы находитесь в организации, это трудно изменить. Мне нравится аналогия, потребительство вещей. И так больше не когда я еду в аэропорт и хочу сменить место - я делаю это на своем мобильном телефоне. Мне не нужно подходить к агенту в кабинке и наблюдать, как этот агент печатает что-то на монохромном мониторе в течение 15 минут, чтобы изменить свое место. Я просто предпочитаю делать это на своем телефоне, и это интересная разработка.

Сегодня мы немного поговорим о коллективном интеллекте. Для тех, кто не знает, Statistica - это передовая аналитическая платформа, которая существует уже более 30 лет. Если вы посмотрите на любую публикацию в области аналитики, она всегда выходит на первое место как один из наиболее интуитивных и простых в использовании пакетов программного обеспечения для аналитики. Итак, последние несколько лет мы работали над концепцией, называемой коллективным разумом, и переходим на следующий уровень. Я хотел начать этот разговор с: как работа выполняется в вашей организации?

И здесь есть два изображения. Слева - изображение 1960-х годов, и я не начал свою карьеру в 1960-х годах, но изображение справа - это полупроводниковый завод, где я начал работать. И я работал в этом черном здании с черной крышей в верхнем левом углу. Но они сделали полупроводниковые вещи. Это недавняя фотография из Google Images. Но когда вы возвращаетесь к изображению 1960-х годов слева, это очень интересно. Эти люди сидят в очереди, и они делают, вы знаете, интегральные схемы и полупроводники. Но есть стандартизация, есть стандартный способ сделать что-то, и был четко определенный процесс. Вы знаете, возможно, так как все эти люди сидят в открытой среде, возможно, было какое-то сотрудничество. Я думаю, что мы потеряли немного этого в рабочей силе знаний.

Когда я сидел в том здании в верхнем левом углу, если я хотел с кем-то сотрудничать, он не был открыт. Были эти офисы, возможно, некоторые из команды были отдаленными, или, возможно, мне пришлось пройти через этот кампус; это была 25-минутная прогулка, и мне нужно было поговорить с кем-нибудь в здании справа. Я думаю, что мы что-то потеряли по пути. Итак, вы знаете, у меня была та же мысль: почему люди - сколько людей продолжают изобретать колесо в вашей организации? Я думаю, вы знаете, организации в целом проделали хорошую работу в 1990-х и 2000-х годах с CRM и хранилищами данных, и в некоторой степени BI. По некоторым причинам аналитика немного отстала. Были значительные инвестиции в хранилище данных, а также в стандартизацию и нормализацию ваших данных, и все это, и CRM, но аналитика по какой-то причине отстала. И мне интересно, почему. Может быть, есть креатив - может быть, ваш процесс не является четко определенным, может быть, вы не знаете, какое решение или рычаг вы пытаетесь повернуть в своем бизнесе, чтобы изменить положение вещей. Сегодня, когда мы заходим в организации, многие люди делают все очень вручную в электронных таблицах.

И вы знаете, сегодня утром я посмотрел статистику, думаю, там написано 80, 90 процентов электронных таблиц имеют ошибки, и некоторые из них могут быть очень существенными. Как в Whale, где JPMorgan Chase потерял миллиарды и миллиарды долларов из-за ошибок в электронных таблицах. Так что у меня есть предпосылка, я думаю, должен быть лучший способ добиться цели. И, как мы уже упоминали, у нас есть эти ученые данных. Эти парни дорогие, и их трудно найти. И иногда они немного странные утки. Но я думаю, вы знаете, если бы мне пришлось подвести итог, кто такой специалист по данным, это, вероятно, тот, кто понимает данные. Я думаю, что это кто-то, кто понимает математику, кто-то, кто понимает проблему. И действительно, кто-то, кто может сообщить результаты. И если вы специалист по данным, вам очень повезло в наши дни, потому что ваша зарплата, вероятно, удвоилась за последние несколько лет.

Но, по правде говоря, у многих организаций нет таких ученых, но в вашей организации есть умные люди. У вас есть организация, у вас много умных людей, и они используют электронные таблицы. Вы знаете, статистика и математика не являются их основной работой, но они используют данные для развития бизнеса. Действительно, проблема, которую мы решаем, состоит в том, как вы решите, если вам повезет, что у вас есть специалист по данным или статистик или два, как вы можете их принять, и как вы можете улучшить сотрудничество между этими людьми и другие люди в вашей организации? Если мы посмотрим на то, как устроена наша организация, я начну и пойду справа налево. И я знаю, что это задом наперед, но у нас есть эта линия бизнес-пользователей.

Это основная часть вашей рабочей силы в сфере знаний, и для этих людей вам необходимо встроить аналитику в свои бизнес-приложения. Возможно, они видят аналитическую информацию на экране центра обработки вызовов или что-то в этом роде, и это говорит им о следующем лучшем предложении, которое можно предложить клиенту. Может быть, это потребитель или поставщик на веб-портале, и он сразу же дает им кредит, или тому подобное. Но идея в том, что они потребляют аналитику. Если мы пойдем в середину, это эти работники умственного труда. Это люди, которые сегодня работают с электронными таблицами, но электронные таблицы подвержены ошибкам и в какой-то момент у них кончается бензин. Вы знаете, что эти гражданские специалисты по данным, как мы их называем, действительно повышают уровень автоматизации.

И вы слышите от аналитиков, что от 80 до 90 процентов работы приходится на подготовку данных, и это не математика, а подготовка данных. Мы пытаемся автоматизировать это, независимо от того, делаете ли вы это, и у нас есть мастера, шаблоны и вещи многократного использования, и вам не обязательно иметь знания о базовой инфраструктуре в вашей среде. И затем, если мы посмотрим на крайний левый, у нас есть эти ученые данных. И, как я уже говорил, они в дефиците. И то, что мы пытаемся сделать, чтобы сделать их более продуктивными, - это позволить им создавать вещи, которые могут делать эти гражданские ученые. Думайте об этом как о блоке Lego, чтобы эти ученые-данные могли создать ресурс многократного использования, который может использовать ученый-гражданин. Постройте его один раз, чтобы нам не пришлось изобретать велосипед заново.

Кроме того, эти парни могут беспокоиться о том, сможем ли мы что-то делать с базой данных и использовать существующие инвестиции в технологии, которые сделала ваша компания. Знаете, в наше время не имеет смысла перетасовывать данные туда-сюда по всему миру. Так что, если мы посмотрим на Statistica, как я уже говорил, это платформа, которая существует довольно давно. И это очень инновационный продукт. Смешивание данных, не было источника данных, к которому мы не могли бы получить доступ. У нас есть все, что вы ожидаете найти и визуализировать данные; мы можем сделать это в режиме реального времени. И это, вероятно, имеет - я думаю, что в программном инструменте более 16 000 аналитических функций, так что это больше математики, чем я когда-либо мог использовать или понять, но он есть, если вам это нужно.

У нас есть возможность комбинировать как бизнес-правила, так и аналитические рабочие процессы, чтобы действительно принимать бизнес-решения. Вы выходите за рамки простого, вот алгоритм, вот рабочий процесс, но у вас есть бизнес-правила, с которыми вам всегда приходится иметь дело. Мы очень безопасны в управлении. Нас используют во многих фармацевтических клиентах, потому что FDA доверяет нам. Вы знаете, просто доказательство в пудинге, что у нас есть средства контроля и возможности аудита, чтобы они были приняты. И, наконец, вы знаете, мы открыты, гибки и расширяемы, поэтому вам нужно создать платформу, которая должна обеспечивать продуктивность ваших исследователей данных, производительность ваших гражданских данных, возможность развернуть эти аналитические результаты для работников в вашей организации.

Если мы посмотрим на это, вот пример некоторых из визуализаций. Но будучи в состоянии распространять свои аналитические данные среди бизнес-пользователей, первый пример слева - это аналитическая диаграмма сети. И, возможно, вы расследуете мошенничество, и вы не знаете, как создаются эти связи, и это могут быть люди, это могут быть юридические лица, это могут быть контракты, что угодно. Но вы можете манипулировать этим с помощью мыши и взаимодействовать с ним, чтобы по-настоящему понять - если вы расследуете мошенничество, чтобы понять приоритетный список того, кому нужно расследовать, верно, потому что вы не можете говорить со всеми, поэтому у вас есть расставить приоритеты.

Если мы посмотрим на изображение с правой стороны, для панели прогнозного обслуживания, это действительно интересная проблема. Возможно, вы владелец аэропорта, и у вас есть эти сканеры тела. Эти сканеры тела, если вы едете в аэропорт, там есть некоторые компоненты, срок годности которых составляет около девяти месяцев. И эти вещи действительно очень дорогие. Если у меня есть несколько точек входа, несколько сканеров в моем аэропорту, номер один, я хочу убедиться, что я укомплектован соответствующим образом на каждом из ворот, и для частей, которые находятся в сканерах, я не хочу заказывать их тоже рано, и я хочу иметь их, прежде чем он сломается. У нас есть возможность, может быть, если у вас есть аэропорт, чтобы иметь возможность предсказать, когда эти вещи сломаются, и предсказать уровень персонала.

Если мы посмотрим на нижний правый угол, это если вы находитесь в производственной среде, это просто графическое представление производственного процесса. И это немного трудно увидеть, но на этих различных секторах процесса есть красный и зеленый светофоры, и поэтому, если я инженер, там будет очень сложная математика, но я могу углубиться в этот конкретный сектор процессов и посмотреть на параметры, и введите это, возможно, вызывая это из-под контроля. Если мы посмотрим на нашего исследователя данных гражданина, наша цель на самом деле состоит в том, чтобы облегчить работу исследователя данных граждан. У нас есть мастера и шаблоны, и одна вещь, которая мне кажется действительно интересной, это то, что у нас есть этот автоматический узел проверки работоспособности данных. И действительно, что он делает, у него есть встроенные смарты.

Я упомянул подготовку данных - это занимает значительное время, как для агрегирования, так и для подготовки данных. Но давайте предположим, что у меня есть мои данные, я могу запустить их через этот узел проверки работоспособности данных, и он проверяет на инвариантность, разреженность и выбросы, и все эти вещи, он заполняет пропущенные значения и выполняет много математических операций. Не понимаю, поэтому я могу принять значения по умолчанию, или, если я немного умнее, я могу их изменить. Но дело в том, что мы хотим автоматизировать этот процесс. Эта вещь делает около 15 различных проверок и результатов на очищенном наборе данных. То, что мы делаем, облегчает людям создание этих рабочих процессов.

Здесь мы говорим о сотрудничестве между специалистами по данным и гражданскими специалистами по данным. Если мы посмотрим на эти изображения справа, мы увидим этот процесс подготовки данных. И, может быть, это очень сложно, может быть, это секретный соус вашей компании, я не знаю, но мы знаем, что кто-то в вашей организации может получить доступ к одному или нескольким хранилищам данных, которые у нас есть. Нам нужен способ, во-первых, схватить их и сшить их вместе, и, во-вторых, может быть, мы хотим сделать специальную обработку, которая выходит за рамки нашей проверки работоспособности данных, и это секретный соус вашей компании. Я могу создать этот рабочий процесс в нашей организации, и он сворачивается как узел. Вы видите стрелку, указывающую вниз, это просто узел, и мы можем иметь сотню таких вещей в организации. Идея в том, что у нас есть люди, которые знают что-то об определенном пространстве, они могут создать рабочий процесс, и кто-то другой может использовать это повторно. Мы пытаемся свести к минимуму переосмысление колеса.

И мы можем сделать то же самое с рабочими процессами аналитического моделирования. В данном случае справа, этот рабочий процесс, может быть, есть 15 различных алгоритмов, и я хочу выбрать лучший для этой задачи. И мне, как гражданину-исследователю данных, не нужно понимать, что происходит в этой паутине, но она просто сворачивается в узел, и, возможно, этот узел просто говорит: «Рассчитайте оценку кредитного риска». «Рассчитайте шанс инфекции места хирургического вмешательства », что у вас. «Рассчитайте вероятность того, что что-то является мошеннической транзакцией». Как гражданин, специалист по данным, я могу использовать эту очень сложную математику, которую создал кто-то другой, может быть, один из этих ученых данных построил в моей организации.

С точки зрения науки о данных, вы знаете, я разговаривал с учеными, которые любят писать код, и я разговаривал с учеными, которые ненавидят писать код. И это нормально, поэтому у нас очень визуальный графический интерфейс пользователя. Мы можем получить наши данные, мы можем сделать нашу автоматическую проверку работоспособности данных, и, возможно, я хочу написать код. Мне нравится Python, мне нравится R, но идея состоит в том, что этих ученых-данных им не хватает, и им нравится код на определенном языке. Мы не особо предпочитаем язык, на котором вы хотите кодировать, поэтому, если вы хотите сделать R, делайте R; если вы хотите сделать Python, сделайте Python. Замечательно. Если вы хотите передать свою аналитику в Azure, отправьте свою аналитику в облако. И поэтому цель здесь - действительно предложить гибкость и варианты, чтобы сделать ваших исследователей данных настолько продуктивными, насколько это возможно.

Теперь исследователи данных, они довольно умные люди, но, возможно, они не специалисты во всем, и, возможно, есть некоторые пробелы в том, что они могут сделать. И если вы посмотрите в отрасль, то существует множество различных аналитических рынков. Это пример того, может быть, мне нужно распознать изображение, а у меня нет этого навыка, ну, может, я пойду в Algorithmia и получу алгоритм распознавания изображений. Возможно я иду в Апервиту и получаю очень специальный алгоритм здравоохранения. Может быть, я хочу использовать что-то в библиотеке машинного обучения Azure. Может быть, я хочу использовать что-то на родной платформе Statistica.

Опять же, идея в том, что мы хотим использовать глобальное аналитическое сообщество. Потому что у вас не будет всех навыков в ваших четырех стенах, поэтому как мы можем создавать программное обеспечение - и это то, что мы делаем - это позволяет вашим ученым данных использовать алгоритмы из различных рынков. Мы давно занимаемся этим с R и Python, но это распространяется и на эти торговые площадки приложений, которые существуют там. И то же самое вы видите здесь, в верхней части этого, мы используем H2O на Spark, поэтому там есть много аналитических алгоритмов. Вам не нужно фокусироваться на создании их с нуля, давайте использовать их, которые живут в сообществе открытого исходного кода, и мы хотим, чтобы эти люди были максимально продуктивными.

Следующий шаг, после того, как у нас есть наши гражданские специалисты по данным и наши специалисты по данным, действительно ли вы продвигаете и распространяете эти лучшие практики? В нашем программном обеспечении есть технология, которая позволяет вам распространять аналитику где угодно. И это скорее вид управления моделью, но я больше не привязан к четырем стенам или к какой-то конкретной установке в Талсе, на Тайване или в Калифорнии, или что там у вас. Это глобальная платформа, и у нас много-много клиентов, которые используют ее на нескольких сайтах.

И действительно, ключевые вещи в том, что если вы делаете что-то на Тайване и хотите повторить это в Бразилии, это здорово. Перейдите туда, возьмите повторно используемые шаблоны, возьмите нужные вам рабочие процессы. Это попытка создать эти стандарты и общий способ ведения дел, поэтому мы не делаем вещи совершенно разные везде. И другой ключевой компонент этого, действительно, мы хотим взять математику, где данные живут. Вам не нужно перетасовывать данные между, вы знаете, Калифорнией и Талсой, а также Тайванем и Бразилией. У нас есть технология, которая позволяет нам анализировать данные, и мы собираемся провести еще одну веб-трансляцию по горячим технологиям на эту тему.

Но мы называем эту архитектуру, и вот небольшая загадка, нативная архитектура распределенной аналитики. Основная идея заключается в том, что у нас есть платформа, Statistica, и я могу экспортировать аналитический рабочий процесс в виде атома. И я мог бы сделать модель или весь рабочий процесс, так что это не имеет значения. Но я могу создать это и экспортировать на языке, соответствующем целевой платформе. На левой стороне этого, многие люди делают это, но они делают оценки в исходной системе. Это хорошо, мы можем делать оценки и строить модели в базе данных, это интересно.

И затем на правой стороне, у нас есть Boomi. Это сопутствующая технология, мы работаем со всеми этими. Но мы также можем взять эти рабочие процессы и, по сути, перенести их в любую точку мира. Все, что имеет IP-адрес. И мне не нужно устанавливать Statistica в публичном или частном облаке. Все, что может запускать JVM, мы можем запускать эти аналитические рабочие процессы, рабочие процессы подготовки данных или просто моделировать на любой из этих целевых платформ. Будь то мое публичное или частное облако, будь то мой трактор, моя машина, мой дом, моя лампочка, мой интернет вещей, у нас есть технология, которая позволяет вам переносить эти рабочие процессы в любую точку мира.

Давайте рассмотрим. Вы знаете, у нас есть ряд бизнес-пользователей, поэтому у этих людей есть технологии, которые позволяют им использовать выходные данные в удобном для них формате. У нас есть специалисты по гражданским данным, и мы пытаемся улучшить сотрудничество, сделать их частью команды, верно? И поэтому мы хотим, чтобы люди перестали изобретать велосипед. И у нас есть эти исследователи данных, там может быть пробел в навыках, но они могут писать на языке, который хотят, они могут выходить на аналитические рынки и использовать там алгоритмы. И так с этим, как вы могли не думать, что все это здорово? Это прекрасно, это то, что мы делаем. Мы создаем многократно используемые рабочие процессы, мы даем людям инструкции, мы даем им блоки Lego, чтобы они могли строить эти могучие замки и все, что они хотят делать. Подводя итог, у нас есть платформа, которая расширяет возможности бизнес-пользователей, гражданских данных, программистов-данных. У нас есть - мы можем рассмотреть любой вид использования граничной аналитики IoT, и мы поддерживаем это понятие коллективного интеллекта. С этим, я думаю, мы, вероятно, откроем это для вопросов.

Робин Блур: Ну хорошо. Я думаю, что первое - я имею в виду, если честно, я имею в виду, что меня уже проинформировали Dell Statistica, и, честно говоря, я на самом деле весьма удивлен тем, что я не знал, что вы подняли в презентации, И я должен сказать, что одна вещь, это то, что было для меня ошибкой в ​​принятии аналитики, это то, что, вы знаете, получение инструментов, не так ли, вы знаете? Там очень много инструментов, есть инструменты с открытым исходным кодом, и так далее, и тому подобное, и есть различные, как я бы сказал, полуплатформы. Но я думаю, что разница, которая у вас есть, меня особенно впечатлила часть рабочего процесса.

Но разница в том, что вы, кажется, обеспечивает конец до конца. Это похоже на то, что аналитика - это сложный бизнес-процесс, который начинается с сбора данных, а затем проходит целый ряд этапов, в зависимости от того, насколько нестабильны данные, и затем может перейти в целую серию различных математических атак на данные. И тогда результаты появляются так или иначе, и это должны быть действия. Я столкнулся с огромным количеством аналитики, где была проделана огромная работа, но ее не удалось реализовать. И у тебя, кажется, очень много того, что требуется. Я не знаю, насколько он исчерпывающий, но он более всеобъемлющий, чем я ожидал. Я невероятно впечатлен этим.

Я хотел бы, чтобы вы прокомментировали таблицы. Вы уже что-то сказали, но одна из вещей, которые я отметил, и я заметил за эти годы, но это становится все более и более очевидным, это то, что есть очень много электронных таблиц, которые являются теневыми системами, и на самом деле я думаю, Я имею в виду, что электронная таблица была замечательным инструментом, когда она была представлена, и с тех пор она была замечательной во многих отношениях, но это обобщенный инструмент, он не совсем подходит для цели. Это, конечно, не очень хорошо в контексте BI, и я думаю, что это ужасно в контексте аналитики. И я хотел бы знать, есть ли у вас какие-либо комментарии по поводу, скажем, примеров, когда, знаете ли, Statistica вышла из строя, чрезмерного использования электронных таблиц или каких-либо комментариев, которые вы хотели бы сделать по этому поводу?

Дэвид Суинор: Да, я думаю, вы знаете, вы можете посмотреть на известные ошибки в таблицах. Google или любая другая поисковая система, которую вы используете, вернется с множеством результатов. Я не думаю, вы знаете, мы когда-нибудь заменим электронные таблицы. Это не наше намерение, но многие организации, в которые я обращаюсь, есть пара волшебников электронных таблиц или ниндзя или как вы хотите их называть, но у них есть эти очень сложные электронные таблицы, и вы должны подумать, что произойдет, когда эти люди выигрывают в лото и они не возвращаются? Итак, что мы пытаемся сделать, так это то, что мы знаем, что электронные таблицы будут существовать, чтобы мы могли их проглотить, но я думаю, что мы пытаемся сделать, это разработать визуальное представление вашего рабочего процесса, чтобы его можно было понять и поделиться с другими людьми, Таблицы довольно сложны, довольно сложны для совместного использования. И как только вы передадите мне свою электронную таблицу, я изменил ее, и теперь мы не синхронизированы и получаем разные ответы. То, что мы пытаемся сделать, это поставить некоторые ограждения вокруг этого и сделать вещи немного более эффективными. А электронные таблицы действительно ужасны при объединении нескольких наборов данных, понимаете? Они падают там. Но мы не собираемся их заменять, мы принимаем их, и у нас есть люди, которые начинают сдвигаться, потому что если у нас есть узел с надписью «рассчитать риск», это то, что пытается сделать человек, использующий электронную таблицу. Так что те ушли.

Робин Блур: Да, я имею в виду, я бы сказал, что, с одной стороны, я смотрю на вещи, я бы сказал, что электронные таблицы отлично подходят для создания информации. Они даже хороши для создания островков знаний, но они действительно плохи для обмена знаниями. У них нет никакого механизма, чтобы делать это вообще, и если вы передаете электронную таблицу кому-то, это не значит, что вы можете прочитать ее, как будто это статья, которая объясняет, что именно они делают. Это просто не там. Я думаю, вы знаете, вещь, которая произвела на меня наибольшее впечатление в презентации и возможностях Statistica, кажется невероятно агностичной. Но этот поток проходит через рабочий процесс. Правильно ли я полагаю, что вы могли бы рассмотреть сквозной рабочий процесс, знаете ли, от сбора данных на всем пути до встраивания результатов в конкретные приложения BI или даже в запущенные приложения?

Дэвид Суинор: Да, конечно . И у него есть такая сквозная возможность, и некоторые организации используют ее целиком, и я не питаю иллюзий, что какая-либо компания в наши дни покупает все у одного поставщика. У нас есть смесь. Некоторые люди используют Statistica для всего, а некоторые используют его для рабочих процессов моделирования, некоторые люди используют его для рабочих процессов подготовки данных. Некоторые люди используют его для раздачи сотен инженерных отчетов инженерам. И поэтому у нас все между ними. И это действительно сквозная и, как вы знаете, агностическая платформа, в том смысле, что если есть алгоритмы, которые вы хотите использовать в R или Python, Azure, Apervita, то, что вы знаете, используют их. Это здорово, быть продуктивным, использовать то, что вы знаете, использовать то, что вам удобно, и у нас есть механизмы, чтобы гарантировать, что они контролируются и проверяются, и все такое.

Робин Блур: Мне особенно нравится этот аспект. Я имею в виду, я не знаю, можете ли вы говорить за пределами того, что вы сказали, богатству того, что там есть. Я имею в виду, я смотрел на это, но я не смотрел на это всесторонне, и, конечно, в наших библиотеках огромное количество библиотек Python, но есть ли что-нибудь, что вы можете добавить к этой картинке? Потому что я думаю, что это очень интересная вещь, вы знаете, идея о том, что у вас будут компоненты, которые заслуживают доверия, потому что вы знали разных людей, которые их создали, и разных людей, которые их использовали, которые вы могли скачать. Вы знаете, вы можете обогатить то, что вы уже сказали об этом?

Дэвид Свинор: Да, я думаю, что некоторые из торговых площадок приложений, вы знаете, торговые площадки алгоритмов, которые там есть. Например, вы знаете, доктор Джон Кромвель из Университета Айовы, он разработал модель, которая будет предсказывать, которая будет использоваться в режиме реального времени, пока нас прооперируют, даст вам оценку, если вы собираетесь получить хирургическая инфекция сайта. И если этот показатель достаточно высок, они предпримут вмешательство прямо в операционной. Это очень интересно. Так что, возможно, есть еще одна больница, которая не такая большая. Apervita - это рынок приложений для здравоохранения для аналитики. Вы можете найти один из них на многих торговых площадках приложений, вы можете найти один и повторно использовать его, и сделка заключается между вами и тем, кто им владеет, но вы можете либо найти один, либо сказать: «Вот то, что мне нужно ». Я думаю, что оно использует это глобальное сообщество, потому что все сегодня являются специалистами, а вы не можете знать все. Я думаю, что R и Python - это одно, но эта идея: «Я хочу сделать эту функцию, разместить спецификацию на одном из этих рынков приложений и попросить кого-нибудь разработать ее для вас». И я думаю, что они могут монетизировать это. это очень интересно и сильно отличается от модели с открытым исходным кодом.

Робин Блур: Хорошо. В любом случае, я передам мяч Дезу. Хочешь погрузиться, Дез?

Дез Бланчфилд: Абсолютно, и я хотел бы остаться на мгновение в электронной таблице, потому что я думаю, что она захватила правильную суть многих из того, о чем мы здесь говорим. И вы сделали комментарий, Робин, относительно перехода от старых электронных таблиц в их физической форме к электронной форме. У нас произошла интересная вещь, когда, знаете, когда электронные таблицы изначально были чем-то, что они представляли собой просто листы бумаги со строками и столбцами, и вы записывали вещи вручную, затем вы проходили и рассчитывали их, либо делая это с макушки головы или с каким-то другим устройством. Но у нас все еще есть возможность допустить ошибки, связанные с почерком или дислексией, и теперь мы заменили их опечатками. Риск состоит в том, что с электронными таблицами профиль риска быстрее и больше, но я думаю, что такие инструменты, как Statistica, инвертируют пирамиду риска.

Я часто рисую эту картинку на доске, изображающей человека в виде фигурки сверху, как одного человека, а затем собираю их внизу, скажем, десять из них внизу этой доски, и я рисую пирамида, где точка пирамиды находится у одного человека, а подножия пирамиды - это собрание людей. И я использую это, чтобы визуализировать идею, что если один человек наверху делает электронную таблицу, делает ошибку и делится ею с десятью людьми, и теперь у нас есть десять копий ошибки. Будьте очень осторожны с вашими макросами и будьте очень осторожны с вашими Visual Basic, если вы собираетесь перейти к этому. Потому что, когда мы создаем электронные инструменты, такие как электронные таблицы, это очень мощно, но также и хорошо, и плохо.

Я думаю, что такие инструменты, как Statistica, дают возможность инвертировать этот профиль риска, и это означает, что теперь вы можете перейти к тому моменту, когда вы получите множество инструментов, доступных для отдельного человека, и, как они идут из множества инструментов в верхней части пирамида, а затем вниз до самого дна, где точка пирамиды, которая теперь переворачивается, является реальным инструментом, если у нас есть команда людей, которые строят эти инструменты и эти алгоритмы. И специалист по данным не должен быть специалистом в области регрессионной аналитики своих данных. Возможно, они смогут использовать этот инструмент, но у вас может быть пять или шесть статистиков, актуарий, ученый по данным и некоторые математики, работающие над этим инструментом, этим модулем, этим алгоритмом, этим плагином и т. Д. На языке электронных таблиц, поэтому представьте себе, что каждая опубликованная электронная таблица, которую вы можете использовать, на самом деле была написана специалистами, которые тестировали макросы, тестировали Visual Basic, проверяли работоспособность алгоритмов, поэтому, когда вы получили его, вы могли просто вставить в него данные, но вы не смогли их сломать. и поэтому было лучше контролировать.

Я думаю, что многие аналитические инструменты делают это. Я полагаю, что дело в том, видите ли вы это сейчас в поле, видите ли вы переход от электронных таблиц, которые потенциально могут привести к ошибкам, ошибкам и риску, к точке, где инструменты, которые вы создаете со своими Платформы сейчас, когда обнаружение данных является точным в реальном времени, а люди, которые строят модули и алгоритмы, удаляют или уменьшают этот профиль риска? Служба поддержки клиентов видит это в реальном смысле или вы думаете, что это просто происходит, и они не осознают этого?

Дэвид Свинор: Вы знаете, я думаю, что есть несколько способов ответить на это. Но то, что мы видим, вы знаете, в любой организации, и я упомянул, что, по-моему, аналитика отстала с точки зрения корпоративных инвестиций, вроде того, что мы сделали с хранилищем данных и CRM. Но то, что мы видим, так что требуется много, чтобы изменить организацию, чтобы преодолеть эту организационную инерцию. Но мы видим, что люди берут свои таблицы, свои рабочие процессы, и я упомянул о безопасности и управлении: «Ну, возможно, у меня есть таблица», «Ну, я могу заблокировать это, и я могу контролировать версию». И мы видим много организаций, может быть, они просто начинают там. И если это изменилось, есть рабочий процесс, и я заканчиваю тем, что ушел, номер один, кто изменил это? Почему они изменили это. Когда они изменили это. И я также могу настроить рабочий процесс таким образом, чтобы я не собирался запускать эту новую электронную таблицу в производство, пока она не будет проверена и подтверждена одной, двумя, тремя, как бы много сторон вы ни определяли в своем рабочем процессе. Я думаю, что люди начинают принимать меры, и организации начинают предпринимать там шаги, но я, вероятно, предположил бы, что у нас еще долгий путь.

Дез Бланчфилд: Действительно, и я думаю, что, учитывая, что вы встраиваете и средства управления безопасностью, и управление там, рабочая нагрузка может автоматически отобразить это и все, вплоть до главного сотрудника по управлению рисками, что сейчас является делом. Вы можете начать контролировать, как к этим инструментам и системам обращаются и кто с ними что-то делает, так что это очень мощно. Я думаю, что другие вещи, которые входят в это, состоят в том, что типы инструментов, которые вы предоставляете, для меня предоставляют человеческое поведение больше, чем традиционные электронные таблицы, о которых мы говорим, в том случае, если у меня есть комната, полная людей с одной и той же панелью мониторинга и доступом к одним и тем же данным, что они могут фактически получить другое представление и, как результат, получить немного отличную информацию из одной и той же информации, которая соответствует их потребностям, чтобы они могли сотрудничать. Затем у нас будет более человечный взгляд и взаимодействие с бизнесом и процессом принятия решений, в отличие от того, что все собираются на одну и ту же встречу с одной и той же PowerPoint и распечатывают одни и те же электронные таблицы, все с одинаковыми фиксированными данными.

Видите ли вы изменения в поведении и культуре в организациях, которые как бы используют ваши инструменты сейчас, когда они видят, что это происходит, когда пять человек в комнате не смотрят на одну и ту же электронную таблицу, пытаясь просто озвучить ее и сделать заметки на ней? Но теперь они на самом деле взаимодействуют с инструментальными панелями и инструментами в режиме реального времени, имея под рукой визуализацию и аналитику, и получают совершенно другой поток разговоров и взаимодействия, не только на собраниях, но и в общем сотрудничестве в рамках всей организации? Потому что они могут делать это в режиме реального времени, потому что они могут задавать вопросы и получать реальный ответ. Это тенденция, которую вы видите в данный момент, или это еще не совсем произошло?

Дэвид Свинор: Нет, я думаю, что это определенно началось с этого пути, и я думаю, что очень интересная вещь, вы знаете, если мы возьмем, например, пример фабрики. Может быть, кто-то, кто владеет определенным сектором процессов на этом заводе, хочет определенным образом просматривать и взаимодействовать с этими данными. И, может быть, я, пропуская все процессы, может быть, этот внизу, может быть, я хочу посмотреть на все это. Я думаю, что мы видим, во-первых, что люди начинают использовать общий набор визуализаций или стандартных визуализаций в своих организациях, но это также соответствует их роли. Если я инженер-технолог, может быть это совсем другой взгляд, чем тот, кто смотрит на это с точки зрения цепочки поставок, и я думаю, что это замечательно, потому что он должен быть адаптирован и должен рассматриваться через призму, которая необходима для выполнения вашей работы.

Дез Бланчфилд: Я полагаю, процесс принятия решений сокращается, с точки зрения времени и скорости, чтобы действительно быстро принимать умные и точные решения, не так ли? Потому что, если у вас есть аналитика в реальном времени, информационные панели в реальном времени, если у вас под рукой есть инструменты Statistica, вам не нужно бегать по полу, чтобы спросить кого-то о чем-то, у вас есть это в печатном виде. Вы можете сотрудничать, взаимодействовать и на самом деле принимать решения на лету и сразу получить такой результат. Я думаю, что некоторые из компаний на самом деле еще не поняли, но когда они это сделают, это будет тот самый момент, когда мы сможем оставаться в наших кабинетах и ​​работать дома, но мы можем взаимодействовать и сотрудничать, и эти решения когда мы сотрудничаем, мы мгновенно превращаемся в результаты. Послушай, я думаю, что было здорово услышать, что ты сказал до сих пор, и я действительно с нетерпением жду, когда это произойдет. И я знаю, что у нас есть много вопросов в вопросах и ответах, поэтому я собираюсь вернуться к Ребекке, чтобы обсудить некоторые из них, чтобы мы могли добраться до них как можно быстрее. Большое спасибо.

Ребекка Джозвиак: Спасибо, Дез, и, да, Дейв, у нас довольно много вопросов от аудитории. И спасибо Дез и Робин за ваши идеи тоже. Я знаю, что этому конкретному участнику пришлось уйти в самый разгар рабочего дня, но она как бы спрашивает: видите ли вы, что отделы информационных систем отдают предпочтение сложным элементам управления данными, а не чувствуют себя комфортно в предоставлении инструментов для работники умственного труда? Я имею в виду, это … давай.

Дэвид Суинор: Да, я думаю, это зависит от организации. Я думаю, что банк, страховая компания, может быть, у них разные приоритеты и способы ведения дел, по сравнению с маркетинговой организацией. Думаю, я бы сказал, что это зависит от отрасли и функции, на которую вы смотрите. Различные отрасли имеют разные фокусы и акценты.

Ребекка Йозвиак: Хорошо, хорошо, это имеет смысл. А потом еще один участник захотел узнать, что стоит за Statistica? Это C ++ или твой собственный материал?

Дэвид Швинор: Ну, я не знаю, смогу ли я получить что-то конкретное с этим, потому что это было около 30 лет, и это было разработано до моего времени, но есть основная библиотека аналитических алгоритмов, которые работают алгоритмы Statistica. И вы видели здесь, что мы также можем запустить R, мы можем запустить Python, мы можем запустить Azure, мы можем работать на Spark в H2O, поэтому я думаю, что мне придется ответить на этот вопрос с точки зрения, это различные движки. И в зависимости от того, какой алгоритм вы выберете, если это будет Statistica, он будет работать следующим образом, если вы выберете один из них на H2O и Spark, он использует его, и поэтому их множество.

Ребекка Йозвиак: Хорошо, хорошо. Другой посетитель спросил, что конкретно указывает на этот слайд, и хотел бы знать, как, например, специалист по гражданским данным узнает, какие шаблоны многократного использования использовать? И я думаю, что я сделаю из этого более широкий вопрос. То, что вы видите, когда приходят бизнес-пользователи или бизнес-аналитики, которые хотят использовать эти инструменты, насколько легко их взять и запустить?

Дэвид Свинор: Я думаю, я бы ответил на это, и если вы можете использовать, если вы знакомы с Windows, это платформа на базе Windows, поэтому я обрезал верхнюю часть этих снимков экрана, но у них есть лента Windows. Но как они узнают, какой рабочий процесс использовать? Он выглядит как проводник Windows, поэтому существует древовидная структура, и вы можете настроить и настроить ее так, как этого хочет ваша организация. Но может быть, у вас просто будут эти папки, и вы поместите эти многократно используемые шаблоны в эти папки. И я думаю, что, вероятно, есть какая-то номенклатура, которую ваша компания могла бы принять, скажем, вот «рассчитать профиль риска», вот «получить данные из этих источников», и вы называете их как хотите. Это просто бесплатная папка, вы просто перетащите заметки прямо на холст. Итак, довольно легко.

Ребекка Йозвиак: Хорошо, хорошо. Может быть, демо в следующий раз. Затем появляется еще один посетитель, и это то, о чем вы, Робин и Дез говорили о неточностях, особенно в электронной таблице, но в мусоре в / мусоре, и он считает это еще более критичным, когда дело доходит до в аналитику. Стоит упомянуть, что, как вы знаете, неправильное использование данных действительно может привести к неудачным решениям. И ему интересно, что вы думаете о разработке более надежных алгоритмов, я полагаю, он использует слово «чрезмерное усердие» в использовании аналитики. Вы знаете, кто-то приходит, они действительно взволнованы, они хотят выполнять эту расширенную аналитику, они хотят запускать эти сложные алгоритмы, но, возможно, они не совсем уверены. Итак, что вы делаете для того, чтобы защититься от этого?

Дэвид Суинор: Да, так что я думаю, что отвечу на это как можно лучше, но я думаю, что все сводится к людям, процессам и технологиям. У нас есть технология, которая помогает людям и помогает любому процессу, который вы хотите внедрить в вашей организации. В примере отправки купона кому-то, может быть, это не так критично, а если он цифровой, то это действительно бесплатно, может быть, есть один уровень контроля безопасности, и, возможно, нам все равно. Если я предсказываю хирургические инфекции на месте, может быть, я хочу быть немного осторожнее с этим. Или, если я прогнозирую качество и безопасность лекарств и тому подобное, может быть, я хочу быть немного осторожнее с этим. Вы правы, мусор в / мусор, поэтому мы пытаемся предоставить платформу, которая позволяет адаптировать ее к любому процессу, который хочет принять ваша организация.

Ребекка Йозвиак: Хорошо, хорошо. У меня есть еще несколько вопросов, но я знаю, что мы прошли немного больше часа, и я просто хочу сказать нашим докладчикам, это было потрясающе. И мы хотим поблагодарить Дэйва Швинора из Dell Statistica. Конечно, доктор Робин Блур и Дез Бланчфилд, спасибо за то, что были аналитиками сегодня. В следующем месяце у нас будет еще одна веб-трансляция с Dell Statistica. Я знаю, что Дейв намекнул на эту тему. Это будет аналитика на краю, еще одна увлекательная тема, и я знаю, что некоторые весьма убедительные варианты использования будут обсуждаться в этой веб-трансляции. Если вам понравилось то, что вы видели сегодня, вернитесь еще в следующем месяце. И с этим, ребята, я прощаюсь с вами. Спасибо. Пока-пока.

Внедрить аналитику повсюду: учёные-исследователи