Сотрудники Techopedia, 22 сентября 2016 г.
Вывод: Ведущая Ребекка Джозвиак обсуждает аналитику с доктором Робином Блором, Дезом Бланчфилдом и Шоном Роджерсом из Dell Statistica.
Вы не вошли в систему. Пожалуйста, войдите или зарегистрируйтесь, чтобы увидеть видео.
Ребекка Йозвиак: Уважаемые дамы и господа, привет и добро пожаловать в «Горячие технологии 2016». Сегодня у нас есть «Edge Analytics: экономика IoT наконец-то». Меня зовут Ребекка Йозвиак. Я буду вашим модератором для сегодняшней веб-трансляции. Мы делаем твит с хэштегом # HOTTECH16, если вы хотите присоединиться к обсуждению в Twitter.
Таким образом, IoT, безусловно, горячая тема этого года и Интернет вещей, на самом деле речь идет о данных машины, данных датчиков, данных журналов, данных устройств. Ничего из этого не является новым, у нас были такие данные навсегда, но это потому, что мы на самом деле не смогли их использовать, и теперь мы видим только тонну новых способов использования этих данных. Особенно в медицинской промышленности, на финансовых рынках, с нефтью и газом, сырьевыми товарами, это просто огромное количество информации, которая ранее не использовалась. И не так много людей действительно хорошо понимают, как сделать это хорошо. Мы говорим о большом количестве маленьких данных, но это много данных, и, знаете, есть проблемы с сетью, аппаратное обеспечение или его необходимо обрабатывать, и как это сделать без засорения вашей системы? Ну, это то, что мы собираемся узнать сегодня.
Вот наш состав экспертов. У нас есть доктор Робин Блур, наш главный аналитик в The Bloor Group. У нас также есть Dez Blanchfield, наш специалист по данным в The Bloor Group. И мы рады, что у нас есть Шон Роджерс, директор по глобальному маркетингу и каналам Dell Statistica. И с этим я собираюсь передать мяч Робину.
Доктор Робин Блур: Хорошо, спасибо за это. Я нажму на кнопку и подброшу слайд. Я понятия не имею, почему я создал эту апокалиптическую картину для Интернета вещей. Возможно, потому что я думаю, что в конце концов это станет хаотично. Я буду двигаться прямо дальше. Это номинально для курса в любой презентации IoT. Вы должны, так или иначе, сказать что-то возмутительное о том, куда все это идет. И на самом деле, большая часть этого, вероятно, правда. Если вы действительно посмотрите на то, как эти кривые постепенно расширяются. Вы знаете, персональные компьютеры, смартфоны и планшеты, вероятно, будут продолжать расти. Умные телевизоры, вероятно, будут расти. Носимые, они, вероятно, сейчас взрываются, по сравнению с тем, что было несколько лет назад. Подключенные автомобили, неизбежно, что почти все автомобили будут подключаться тщательно и постоянно передавать данные. И все остальное. И этот конкретный график BI Intelligence показывает, что все остальное перевесит очевидные вещи очень и очень быстро.
Так что сказать о IoT? Первое - это просто архитектурная точка. Вы знаете, когда у вас есть данные, и вы обрабатываете их, так или иначе, вам придется соединить их вместе. И с данными в том объеме, в котором они сейчас находятся, и собираясь в разных местах, они больше не естественно вместе. Наверное, они были в старые времена мэйнфреймов. Таким образом, вы можете думать о существовании уровня обработки, транспортного уровня и уровня данных. И так или иначе, транспортный уровень в настоящее время собирается перемещать обработку или перемещать данные по сетям. Итак, вот варианты: вы можете переместить данные в обработку, вы можете переместить обработку в данные, вы можете переместить обработку и данные в удобную точку выполнения, или вы можете разделить обработку и разделить данные. А что касается интернета вещей, данные уже почти полностью уничтожены при рождении, и существует вероятность того, что огромная часть обработки будет отброшена для того, чтобы могли выполняться приложения, которые должны быть запущены.
Итак, я нарисовал картину. Интересная вещь для IoT, я говорю о домене агрегации на этой диаграмме, и я указываю, что есть субдомены. Таким образом, вы можете себе представить, что домен IoT 1 здесь является своего рода автомобилем, а домен 2, домен 3 и домен 4 - это автомобили определенного типа, и вы будете собирать данные локально, запускать локальные приложения для этих данных и вы приведете в действие разные вещи. Но для того, чтобы иметь аналитику обо всех автомобилях, вам нужно будет передавать данные в центр, не обязательно все данные, но вам придется собирать данные в центре. И если вы подумаете об этом, то вы можете захотеть иметь много-много разных доменов агрегации для одного и того же набора вещей IoT. И сами домены могут еще больше агрегировать. Таким образом, вы могли бы иметь эту повторяющуюся иерархию. И в основном у нас получается невероятно сложная сеть. Гораздо сложнее, чем все, что мы должны были иметь раньше.
У меня здесь записка внизу. Все сетевые узлы, включая конечные узлы, могут быть создателями данных, хранилищами данных и точками обработки. И это дает вам возможность распространения, подобного которому мы не видели раньше. Дез расскажет об этом немного больше, поэтому я перейду к этому конкретному вопросу. Как только мы находимся в Интернете вещей, и все данные фактически превращаются в события, смысл этого слайда состоит в том, чтобы просто указать, что нам нужно стандартизировать события. Нам нужно, по крайней мере, нам нужно это иметь. У нас будет время, когда произошло событие, географическое положение, в котором оно произошло, виртуальное или логическое расположение процесса, который его создал, исходное устройство, которое его создало, идентификатор устройства, чтобы вы точно знали, какое исходное устройство его создало, собственник данных и действующих лиц, тех людей, которые имеют право использовать данные тем или иным образом, им придется иметь при себе свои разрешения, а это значит, что на самом деле, они должны иметь с собой безопасность, а затем есть сами данные. И когда вы смотрите на это, вы понимаете, что, знаете, даже если у вас есть датчик, который ничего не делает, кроме сообщения о температуре чего-либо каждую секунду или около того, на самом деле достаточно много данных, чтобы просто точно определить, где эти данные возникла и что это на самом деле. Кстати, это не исчерпывающий список.
Итак, с точки зрения будущего ИТ-ландшафта, то, как я это вижу, таково: это не просто интернет вещей, но и тот факт, что мы окажемся в мире событийно-ориентированной деятельности, и поэтому мы должны иметь управляемые событиями архитектуры, и эти архитектуры будут охватывать большие сети. И другая вещь - это все в режиме реального времени, мы не обязательно должны быть в режиме реального времени, но есть кое-что, что я называю бизнес-временем, то есть временем, в течение которого данные фактически должны быть обработаны и готовы обработано. Это может быть не через миллисекунду после его создания. Но всегда есть такое время для каждого фрагмента данных, и как только вы получаете управляемую событиями архитектуру, становится все более разумным думать с точки зрения подхода в реальном времени к тому, как устроен мир.
Так что все сводится к тому, что мы на самом деле говорим об аналитике по IoT. Несмотря на все это, по-прежнему настало время для понимания, и это не просто время для понимания, за ним должны следовать действия. Итак, время для понимания и время для действий - это то, к чему я бы сводил это. Сказав это, я передам мяч обратно Дезу.
Дез Бланчфилд: Спасибо, Робин. Проницательный, как всегда. Мне нравится тот факт, что это трудный акт для подражания в каждом случае, но я сделаю все возможное.
Честно говоря, это одна из вещей, которую я вижу, и меня часто развлекает, и не в лукавом и не отрицательном виде, но есть много беспокойства и паники по поводу того, что Интернет захватывает мир и отсортируйте нас, и вы начнете терять свои данные, поэтому я хочу немного оглянуться назад на некоторые из вещей, которые мы делали ранее в последние два-три десятилетия, которые были близки к факсу в Интернете вещей, но, возможно, не совсем в том же масштабе. И просто, чтобы показать нам, что мы на самом деле были здесь и решили некоторые проблемы, не на этом уровне масштаба и не на такой скорости. Потому что это означает, что мы действительно можем решить проблему и что мы знаем, каковы некоторые из ответов; мы только что успокоились и применили некоторые уроки, которые у нас были раньше. И я знаю, что это весь разговор, который мы собираемся провести, и у меня есть целый ряд интересных вещей, о которых можно просто поболтать в разделе вопросов и ответов.
Но когда мы думаем об интернете вещей в кругу, в настоящее время наблюдается большая централизация на уровне дизайна, которая была написана в самом начале. Например, все устройства Fitbit имеют тенденцию перемещаться в одно центральное место, и, скорее всего, они будут размещаться где-то на облачной платформе, и все эти данные со всех этих устройств попадают в один и тот же, скажем так, внешний интерфейс стека, включая веб и приложения и сервисы на основе данных. Но со временем этот масштаб потребует реинжиниринга, чтобы справиться с объемом поступающих к ним данных, и они будут реорганизовывать его, чтобы в нескольких местах и регионах было несколько внешних интерфейсов и несколько копий стека. И мы видим это, и есть несколько примеров, которые я собираюсь привести вам, которые мы можем обсудить.
Ключевым моментом этого является то, что, хотя мы видели некоторые из этих решений, которые я собираюсь охватить, масштаб и объем данных и сетевой трафик, который будет генерировать Интернет вещей, срочно требует перехода от центрального на распределенную архитектуру, на мой взгляд, и мы знаем это, но мы не обязательно поняли, что это за решение. Когда мы думаем о концепции Интернета вещей, это масштабная модель сети. Это очень много вещей, которые сейчас делают шум. Вещи, которые не шумели до недавнего времени. И на самом деле, я думаю, что это было вчера, я в шутку говорил о стеке, но я пошел покупать новый тостер, и у него была опция, которая могла бы рассказать мне разные вещи, в том числе, когда он нуждался в чистке. И новая микроволновая печь с очень похожей функцией, которая может даже пинговать приложение на моем телефоне, чтобы сказать, что то, что я разогревал, теперь сделано. И я очень полагаю, что если есть пара вещей, которые я не хочу говорить со мной, это мой холодильник, микроволновка и тостеры. Мне очень удобно, когда они глупые устройства. Но недавно у меня появилась новая машина, маленькая Ауди, и она говорит со мной, и я очень доволен этим, потому что вещи, о которых она говорит, представляют интерес. Как обновление карт в режиме реального времени, чтобы сказать мне, где есть лучший маршрут, чтобы добраться из точки А в точку Б, потому что это обнаруженный трафик через различные механизмы с данными, которые он отправляет.
У меня есть этот слайд. Мы уже видели, что модели сетей большого объема требуют перехода от централизованного к распределенному захвату и доставке моделей обработки данных и аналитики. Мы видели, как вещи движутся от трех маленьких графических диаграмм там, на правом краю, где у нас есть, слева от трех, есть централизованная модель, в которой все маленькие устройства располагаются в центре и собирать данные и масштаб не так уж велик, они прекрасно справляются там. В середине у нас есть немного более децентрализованная модель и центр, и речь, которая, как я думаю, нам понадобится в интернете вещей в следующем поколении. И затем с правой стороны у нас есть эта полностью распределенная и объединенная сеть, в которую интернет вещей и машина-машина собирается пойти в очень короткий срок в будущем, но мы не совсем там по ряду причин. И в основном потому, что мы используем интернет-платформы для большей части коммуникаций и на самом деле мы не создали вторую сеть для передачи большого количества этих данных.
Уже существуют вторые сети, такие как сеть Batelco. Многие люди не думают о том, что телекоммуникационные сети не являются Интернетом. Интернет - это совершенно отдельная вещь во многих отношениях. Они направляют данные со смартфонов по телефонным сетям, а затем по телефонным сетям и в Интернет в целом, где они на самом деле распределяют их по двум сетям. Но вполне возможно и вероятно, что интернету вещей понадобится другая сеть. Мы говорим об индустриальном интернете как о теме в целом, но сейчас мы не будем вдаваться в подробности, но, по сути, мы говорим о другой сети, специально разработанной для типов передачи данных или Интернета вещей и «машина-машина». коммуникации.
Но некоторые примеры, которыми я хотел бы поделиться, где мы видели, как большие сети и распределенные данные работают очень хорошо, это такие вещи, как Интернет. Интернет был специально разработан и спроектирован с первого дня, чтобы быть способным пережить ядерную войну. Если часть США взорвалась, Интернет был спроектирован так, чтобы данные могли перемещаться по Интернету без потери пакетов по причинам, по которым мы все еще на связи. И это все еще существует сегодня в глобальном масштабе. Интернет имеет множество возможностей по резервированию и маршрутизации пакетов. И на самом деле Интернет контролируется так называемыми BGP, Border Gateway Protocol и Border Gateway Protocol, BGP, специально разработан для того, чтобы справиться с тем, что маршрутизатор, коммутатор или сервер отключены. Когда вы отправляете или получаете электронное письмо, если вы отправляете три электронных письма подряд, нет никакой гарантии, что каждое из этих электронных писем будет следовать по одному и тому же маршруту в один и тот же конечный пункт назначения. Они могут перемещаться по разным частям интернета по разным причинам. Возможны перебои в работе, могут быть окна технического обслуживания, в которых обновляются автономные объекты, может быть просто перегруженность сети, и мы видим, что с такими вещами, как транспортные сети с автомобилями, общественным транспортом, кораблями и самолетами. Мы получаем контент на наши устройства, такие как ноутбуки, планшеты и компьютеры, через браузеры и т. Д. Каждый день через сети доставки контента. Сети доставки контента предназначены для получения копий контента с вашей основной обслуживающей платформы, такой как веб-сервер, и перемещения его копий и небольшого объема кэша на периферию сети и только для доставки его вам из ближайшей части грани.
Антиспам и кибербезопасность - если в Канаде происходит спам, и Microsoft обнаруживает его и видит, что существует множество копий одного и того же электронного письма, отправляемого группе случайных людей, для этого берутся контрольные суммы, подпись для этого сообщения создан и помещен в сеть и сразу же распространен. И так, что электронная почта никогда не попадает в мой почтовый ящик, или, если это так, она сразу же помечается как спам, потому что она была обнаружена где-то еще на краю сети. И поэтому другим частям сети сообщается об этой подписи спам-сообщения, и она помещается в индекс базы данных, и если эти сообщения начинают появляться на другой стороне планеты, мы обнаруживаем их и знаем, что они являются спамом. И то же самое относится к кибербезопасности. Взлом, который происходит на одной стороне планеты, обнаруживается, регистрируется и сопоставляется, и внезапно в другой части сети мы можем бороться с ним, регистрировать правила и политики и изменять, чтобы посмотреть, сможем ли мы его заблокировать. Особенно с новым влиянием таких вещей, как отказ в обслуживании или распределенный отказ в обслуживании, когда тысячи компьютеров используются для атаки на центральный веб-сайт.
Биткойн и блокчейн, по умолчанию, по своей природе представляют собой распределенный регистр, блокчейн, и справляются с любыми сбоями или сбоями в сети. Обнаружение и предотвращение мошенничества, электроснабжение и водоснабжение - мы видим, вы знаете, сеть электропитания, если одна часть сети получает на ней землю и вынимает столб и провод, мой дом все еще получает электричество. Я даже не знаю об этом, я часто даже не вижу этого в новостях. И мы все привыкли к транспортным сетям, где изначально была централизованная модель «Все дороги вели в Рим», как они говорят, и затем в конечном итоге нам пришлось перейти к децентрализованной модели со ступицами и спицами, а затем мы пошли в сетчатую сеть, где вы можете добраться из одной части города в другую через различные сетчатые маршруты и различные перекрестки. И вот что мы видим здесь, так это то, что эта централизованная модель того, что мы сейчас делаем с интернетом вещей, должна будет вытолкнуть на край сети. И это относится к аналитике больше, чем когда-либо, и это то, что нам нужно распространять аналитику в сеть. И для этого требуется совершенно новый подход к тому, как мы получаем и обрабатываем эти данные и потоки данных, на мой взгляд. Сейчас мы говорим о сценарии, в котором, как мне кажется, мы видим ограниченный интеллект, вытесняемый на край сети на устройствах, подключенных к Интернету, но мы скоро увидим, как эти устройства повышают интеллект и повышают уровень аналитики, который они хотят сделать. И в результате этого нам нужно будет продвигать эти смарты все дальше и дальше через сеть.
Например, интеллектуальные приложения и социальные сети - если мы думаем о социальных сетях и некоторых интеллектуальных приложениях, они по-прежнему играют центральную роль. Вы знаете, есть только два или три центра обработки данных для подобных Facebook. Google стал намного более децентрализованным, но количество центров обработки данных по всему миру все еще ограничено. Затем, когда мы думаем о персонализации контента, вы должны думать на местном уровне. Многое из этого делается в вашем браузере или на локальном сетевом уровне доставки контента. И мы думаем о трекерах для здоровья и фитнеса - многие данные, которые собираются с них, анализируются локально, и поэтому новые версии устройств Garmin и Fitbit, которые вы надеваете на запястье, становятся умнее и умнее в устройстве., Теперь они не отправляют все данные о вашем пульсе обратно на централизованный сервер, чтобы попытаться выполнить аналитику; они встраивают этот интеллект прямо в устройство. В автомобильной навигации раньше было то, что машина будет постоянно получать обновления и карты из центрального местоположения, теперь смарты находятся в машине, и машина сама принимает решения, и в конечном итоге машины будут сцепляться. Автомобили будут общаться друг с другом через беспроводные сети некоторой формы, которые могут быть через беспроводную сеть 3G или 4G в следующем поколении, но в конечном итоге это будет устройство от устройства к устройству. И единственный способ справиться с этим - сделать устройства умнее.
У нас уже есть системы аварийного оповещения, которые собирают информацию локально и отправляют ее централизованно или в ячеистую сеть и принимают решения о том, что происходит локально. Например, в Японии есть приложения, которые люди запускают на своих смартфонах с акселерометрами в смартфоне. Акселерометры в смартфоне будут обнаруживать вибрации и движения и могут определять разницу между обычным повседневным движением и толчками и ударами землетрясения. И этот телефон начнет оповещать вас немедленно, локально. Фактическое приложение знает, что оно обнаруживает землетрясения. Но он также разделяет эти данные через сеть в распределенном концентраторе и модели луча, чтобы люди, находящиеся рядом с вами, были предупреждены сразу или как можно скорее, когда данные проходят через сеть. И затем, в конце концов, когда он попадает в центральное местоположение или в распределенную копию центрального местоположения, он отталкивает людей, которые не находятся в непосредственной близости, не обнаружили движения планеты, но должны быть предупреждены об этом, потому что может быть, цунами идет.
А интеллектуальная городская инфраструктура - концепция интеллектуальной инфраструктуры, мы уже встраиваем интеллект в интеллектуальные здания и интеллектуальную инфраструктуру. Фактически, вчера я припарковал свою машину в городе в новом районе, где часть города ремонтируется и перестраивается. И они переделали все улицы, и на улицах есть датчики, и реальный парковочный счетчик знает, что когда я еду на машине, он знает, что когда я иду, чтобы освежиться, для двухчасового лимита, что машина не двигалась, и на самом деле она не позволила бы мне долить и остаться еще на два часа. Я должен был сесть в машину, выйти из помещения, а затем отъехать назад, чтобы обмануть его, чтобы я мог оставаться там еще два часа. Но что интересно, в конечном итоге мы подходим к тому, что не только обнаружение автомобиля, въезжающего на территорию в качестве локализованного датчика, но и такие вещи, как оптические характеристики, когда распознавание будет применяться с помощью камер, смотрящих на мой номерной знак, и оно будет знать что я на самом деле просто вытащил и втянул назад и обманул его, и это просто не позволит мне возобновиться, и я буду двигаться дальше. А затем он распространит эти данные и убедится, что я не могу сделать это где-либо еще, а также постоянно обманывает сеть. Потому что по природе это должно стать умнее, иначе мы все продолжим его обманывать.
Есть пример этого, где я лично жил в технологии брандмауэров, в конце 80-х и начале 90-х, в продукте под названием Check Point FireWall-1. Очень простая технология брандмауэра, которую мы использовали для создания правил и создания политик и правил вокруг определенных вещей, которые говорят о том, что типы трафика через определенные порты и IP-адреса и сети для доступа друг к другу и друг к другу, веб-трафик из одного места в другое, переход от конца браузера и клиента к концу нашего сервера. Мы решили эту проблему, фактически сняв логику с самих брандмауэров и фактически переместив ее в ASIC, специализированную интегральную схему. Он контролировал порты в коммутаторах Ethernet. Мы обнаружили, что серверные компьютеры, компьютеры, которые мы фактически использовали в качестве серверов для принятия решений в качестве брандмауэров, не были достаточно мощными, чтобы обрабатывать объем трафика, проходящего через них, для каждого небольшого осмотра пакетов. Мы решили эту проблему, переместив логику, необходимую для проверки пакетов и обнаружения интернета, в сетевые коммутаторы, которые были распределены и способны обрабатывать объем данных, проходящих через сетевой уровень. Мы не беспокоились об этом на централизованном уровне с брандмауэрами, мы перенесли его на коммутаторы.
И поэтому мы заставили производителей создать для нас возможность внедрять пути, правила и политики в коммутатор Ethernet, чтобы на фактическом уровне портов Ethernet и, возможно, многим людям в пуле это не было известно, потому что мы теперь все они живут в беспроводном мире, но когда-то все должно было подключаться через Ethernet. Теперь на уровне порта Ethernet мы проверяли пакеты, чтобы увидеть, разрешено ли пакетам перемещаться в коммутатор и в сеть. Отчасти это то, что мы сейчас решаем в связи с этой задачей сбора данных в сети, в частности с устройств IRT, их проверки, анализа и, возможно, анализа в реальном времени для принятия решений по ним. И некоторые из них, чтобы получить представление о бизнес-аналитике и информации о том, как люди принимают лучшие решения, а также другую аналитику и производительность для вещей уровня машина-машина, где устройства общаются с устройствами и принимают решения.
И это будет тенденция, которую мы должны рассмотреть в ближайшем будущем, потому что, если мы этого не сделаем, мы просто закончим с этим потоком шума. И мы видели в мире больших данных, мы видели, как такие вещи, как озера данных, превращаются в болота данных, которые мы просто в результате получаем поток шума, который мы не выяснили, как решить аналитику обработки в централизованном мода. Если мы не решим эту проблему, на мой взгляд, с помощью IoT и получим решение для платформы очень быстро, мы окажемся в очень, очень плохом месте.
Имея это в виду, я собираюсь завершить свою мысль, заключающуюся в том, что я считаю, что одно из самых больших изменений, происходящих в области больших данных и аналитики, в настоящее время обусловлено насущной необходимостью реагировать на воздействие Интернета. вещей в аналитике большого объема и в реальном времени, в том, что нам нужно переместить аналитику в сеть, а затем в конечном итоге на край сети, чтобы справиться с ее огромным объемом, просто обработать. И затем, в конце концов, мы надеемся, что мы поместим интеллект в сеть и периферию сети в модель хаба и спиц, чтобы мы могли реально управлять ею, получать информацию в режиме реального времени и получать от нее пользу. И с этим я собираюсь перейти к нашему гостю и посмотреть, куда нас ведет этот разговор.
Шон Роджерс: Большое спасибо. Это Шон Роджерс из Dell Statistica, и, для начала, я полностью согласен со всеми основными темами, которые здесь затрагивались. И Ребекка, вы начали с идеи о том, что эти данные не новы, и для меня замечательно, сколько времени и энергии уходит на обсуждение данных, данных, данных IoT. И это, безусловно, актуально, знаете ли, Робин сделал хорошую мысль, даже если вы делаете что-то действительно простое, и вы используете термостат раз в секунду, вы знаете, вы делаете это 24 часа в сутки, и у вас действительно есть Знаешь, некоторые интересные проблемы с данными. Но, вы знаете, в конце концов - и я думаю, что многие люди в отрасли говорят о данных таким образом - что это на самом деле не так уж интересно и, с точки зрения Ребекки, это было хорошо, долгое время, но в прошлом мы не могли его использовать. И я думаю, что индустрия передовой аналитики и индустрия бизнес-аналитики в целом начинают по-настоящему обращать свое внимание на IoT. И Дез, к вашему последнему выводу, это является частью или одним из сложных моментов ландшафта больших данных, я думаю, это очень верно. Я думаю, что все очень взволнованы тем, что мы можем сделать с этим типом данных, но в то же время, если мы не можем понять, как применить понимание, предпринять действия и, вы знаете, получить аналитику, где данные, я думаю у нас будут проблемы, которые люди не видят на своем пути.
С учетом вышесказанного, в области расширенной аналитики мы большие поклонники того, что, по нашему мнению, может произойти с данными IoT, особенно если мы применяем аналитику к ним. И на этом слайде очень много информации, и я позволю всем просто поохотиться и поглядеть, но если вы посмотрите на различные секторы, такие как розничная торговля, в крайнем правом положении, то увидите, как у них появляется возможность стать более инновационными или иметь некоторые Экономия средств, оптимизация или усовершенствование процессов очень важны, и они рассматривают множество вариантов использования для этого. Если вы посмотрите, как вы знаете, слева направо на слайде, вы увидите, как каждая из этих отдельных отраслей требует новых возможностей и новых дифференцирующих возможностей для себя, когда они применяют аналитику в IoT. И я думаю, суть в том, что если вы собираетесь идти по этому пути, вам нужно не только беспокоиться о данных, как мы обсуждали, и об архитектуре, но вы также должны посмотреть, как лучше всего применить аналитику к нему и где аналитика должна иметь место.
Знаете, для многих из нас по сегодняшнему разговору Робин и я знали друг друга очень давно, и в прошлом у них было бесчисленное множество разговоров о традиционных архитектурах, о централизованных базах данных или корпоративных хранилищах данных и т. Д. мы обнаружили, что за последнее десятилетие мы проделали довольно хорошую работу по расширению ограничений этих инфраструктур. И они не такие стойкие и не такие сильные, какими мы хотели бы, чтобы они были сегодня, чтобы поддерживать всю великолепную аналитику, которую мы применяем к информации, и, конечно, информация нарушает архитектуру, вы знаете, скорость данных, объем данных и т. д. определенно расширяют ограничения некоторых из наших более традиционных подходов и стратегий для этого типа работы. И поэтому я думаю, что это как бы начинает требовать от компаний более гибкой и, возможно, более гибкой точки зрения на это, и я думаю, что именно с этой стороны я бы хотел немного поговорить о IoT-стороне.
Прежде чем я это сделаю, я возьму минутку, чтобы просто позволить всем звонить, рассказать вам немного о том, что такое Statistica и что мы делаем. Как видно из названия этого слайда, Statistica - это интеллектуальная аналитика, большие данные и визуализация для платформы IoT. Самому продукту немногим более 30 лет, и мы конкурируем с другими лидерами рынка, с которыми вы, вероятно, знакомы, в плане применения прогнозирующей аналитики, расширенной аналитики к данным. Мы увидели возможность расширить сферу наших возможностей в области аналитики и некоторое время назад начали работать над некоторыми технологиями, которые довольно неплохо помогли нам воспользоваться тем, о чем сегодня говорили и Дез, и Робин, что является этим новым подходом и куда вы собираетесь поместить аналитику и как вы собираетесь объединить ее с данными. Вдоль этой стороны идут и другие вещи, которые вы должны уметь решать с помощью платформы, и, как я уже упоминал, Statistica уже довольно давно присутствует на рынке. Мы очень хорошо разбираемся в вопросах смешивания данных, и я думаю, вы знаете, мы не слишком много говорили о доступе к данным сегодня, но смогли охватить эти разнообразные сети и получить нужные данные на нужное время становится все более интересным и важным для конечных пользователей.
Наконец, я прокомментирую еще одну часть здесь, потому что Дез хорошо оценил сами сети, имея некоторый уровень контроля и безопасности над аналитическими моделями в вашей среде, и то, как они привязываются к данным, становится очень важным. Когда я попал в эту отрасль несколько лет назад - я думаю, что к этому моменту почти 20 - когда мы говорили о продвинутой аналитике, это было в очень кураторской манере. Лишь пара человек в организации взялись за него, они развернули его и дали людям ответ по мере необходимости или предоставили информацию по мере необходимости. Это действительно меняется, и мы видим, что многие люди работали с одним или несколькими разнообразными и более гибкими способами доступа к данным, применяя безопасность и управление к данным, а затем могли сотрудничать с ними. Вот некоторые из важных вещей, на которые смотрит Dell Statistica.
Но я хочу углубиться в тему, которая немного ближе к сегодняшнему названию, а именно, как мы должны обращаться к данным, поступающим из Интернета вещей, и к тому, что вы, возможно, захотите искать, когда смотрите на различные решения. Слайд, который я сейчас вижу перед вами, является своего рода традиционным представлением, и Дез и Робин как бы затронули эту идею, вы знаете, эту идею разговора с датчиком, будь то автомобиль, тостер или ветряная турбина, или что там у вас, и затем перемещение этих данных из источника данных в вашу сеть обратно в централизованную конфигурацию, как упоминал Дез. И эта сеть довольно хорошо работает, и многие компании, попавшие в пространство IoT, изначально начинают делать это с этой моделью.
Еще одна вещь, которая возникла, если вы посмотрите на нижнюю часть слайда, это идея взять другие традиционные источники данных, расширить ваши данные IoT, а затем на ядро такого рода, независимо от того, является ли ваше ядро центром обработки данных или может быть в облаке, это не имеет значения, вы берете такой продукт, как Statistica, а затем применяете аналитику к нему и затем предоставляете эту информацию потребителям справа. И я думаю, что это настольные ставки на данный момент. Это то, что вы должны быть в состоянии сделать, и у вас должна быть достаточно открытая архитектура для расширенной аналитической платформы и говорить со всеми этими, разнообразными источниками данных, со всеми этими датчиками и со всеми этими различными местами назначения, где у вас есть данные. И я думаю, что это то, что вы должны быть в состоянии сделать, и я думаю, вы поймете, что это правда, что многие лидеры на рынке способны делать такие вещи. Здесь, в Statistica, мы говорим об этом как об основной аналитике. Получите данные, верните данные в ядро, обработайте их, добавьте больше данных, если это необходимо или, если это выгодно, проведите аналитику, а затем предоставьте эту информацию для действия или для понимания.
И поэтому я думаю, что это, безусловно, с функциональной точки зрения, мы, вероятно, все согласимся с тем, что, вы знаете, это самая необходимая необходимость, и каждый должен делать это. Где это начинает становиться интересным, когда у вас есть огромные объемы данных, вы знаете, поступающие из различных источников данных, таких как датчики IoT, как я уже упоминал, будь то автомобиль, камера видеонаблюдения или производственный процесс, там начинает становиться преимущество в том, что можно делать аналитику там, где на самом деле производятся данные. И преимущество большинства людей, я думаю, когда мы начинаем перемещать аналитику от ядра к краю, состоит в том, что она способна распространять некоторые возникающие проблемы с данными, и Дез и Робин, вероятно, прокомментируют это в конце сегодня, но я думаю, что вы должны быть в состоянии контролировать данные и предпринимать какие-либо действия на периферии, чтобы не всегда было необходимо передавать все эти данные в вашу сеть. Робин говорил об этом на своих архитектурных картинах, которые он составил, где у вас есть все эти разные источники, но обычно есть некоторая точка агрегации. Точка агрегации, которую мы видим довольно часто, находится либо на уровне датчика, но еще чаще на уровне шлюза. И эти шлюзы существуют как своего рода посредник в потоке данных из источников данных, прежде чем вы вернетесь к ядру.
Одна из возможностей, которыми воспользовалась Dell Statistica, заключается в том, что мы можем экспортировать модель из нашей централизованной платформы расширенной аналитики, чтобы иметь возможность взять модель и затем выполнить эту модель на периферии на другой платформе, например, на шлюзе или внутри. базы данных, или что у вас. И я думаю, что гибкость, которая дает нам это то, что действительно интересно в сегодняшнем разговоре, есть ли у вас это в вашей инфраструктуре сегодня? Вы способны переместить аналитику туда, где живут данные, или просто переместить данные туда, где живут аналитики? И это то, на чем Statistica занимается в течение достаточно долгого времени, и если вы посмотрите на слайды поближе, то увидите, что там есть какая-то другая технология от нашей дочерней компании Dell Boomi. Dell Boomi - это платформа для интеграции данных и интеграции приложений в облаке, и мы фактически используем Dell Boomi в качестве устройства для передачи трафика, чтобы переместить наши модели из Dell Statistica, через Boomi и на периферийные устройства. И мы думаем, что это гибкий подход, который компании будут требовать, так же, как им нравится версия, которую я показал вам минуту назад, которая является своего рода основной идеей перемещения данных от датчиков вплоть до Центр, в то же время компании захотят сделать это так, как я здесь обрисовал. И преимущества для этого заключаются в некоторых моментах, которые высказали и Робин, и Дез, а именно: можете ли вы принять решение и действовать со скоростью вашего бизнеса? Можете ли вы перенести аналитику из одного места в другое и сэкономить время, деньги и энергию, а также сложность постоянного перемещения этих пограничных данных обратно в ядро.
Теперь я первый, кто скажет, что некоторые из пограничных данных всегда будут иметь достаточно высокую ценность, так как имело бы смысл хранить эти данные и сохранять их и возвращать в свою сеть, но какая аналитика позволит вам означает ли способность принимать решения со скоростью, к которой фактически поступают данные, верно? То, что вы можете применить понимание и действие со скоростью, при которой максимально возможное значение. И я думаю, что это то, что мы все будем искать, когда речь заходит об использовании передовой аналитики, а данные IoT - это возможность двигаться со скоростью бизнеса или со скоростью, которую требует клиент. Я думаю, что наша позиция заключается в том, что я думаю, что вы должны быть в состоянии сделать оба. И я думаю, что довольно скоро и очень быстро, поскольку все больше компаний рассматривают более разнообразные наборы данных, особенно со стороны IoT, они начнут смотреть на пространство поставщиков и требовать, на что способен Statistica. Что означает развертывание модели в ядре, как мы это делали традиционно в течение многих лет, или развертывание ее на платформах, которые могут быть, возможно, нетрадиционными, например, шлюз IoT, и чтобы фактически иметь возможность оценивать и применять аналитику к данным на краю, как данные производятся. И я думаю, что именно здесь начинается захватывающая часть этого разговора. Потому что, имея возможность применять аналитику на грани в то время, когда данные поступают с датчика, позволяет нам действовать так быстро, как нам нужно, но также позволяет нам решить, должны ли эти данные немедленно возвращаться к ядру? Можем ли мы сделать это здесь, а затем отправить его обратно по частям и провести дальнейший анализ позже? И это то, что мы видим, как делают многие наши ведущие клиенты.
Способ, которым Dell Statistica делает это, заключается в том, что у нас есть возможность использовать его, например, вы строите нейронную сеть внутри Statistica и хотите разместить нейронную сеть где-то еще в своем ландшафте данных. У нас есть возможность выводить эти модели и все языки, которые вы заметили в правом углу - Java, PPML, C и SQL и т. Д., Мы также включаем Python и также можем экспортировать наши скрипты - и когда вы перемещаете это с нашей платформы, которая является централизованной, вы можете затем развернуть эту модель или этот алгоритм там, где вам это нужно. И, как я упоминал ранее, мы используем Dell Boomi для его размещения и парковки там, где нам нужно его запустить, а затем мы можем вернуть результаты, или мы можем помочь вернуть данные или оценить данные и предпринять действия, используя наш механизм правил, Все эти вещи становятся своего рода важными, когда мы начинаем смотреть на этот тип данных, и мы снова думаем.
Это то, что большинству из вас по телефону придется делать, потому что это станет очень дорого и обременительно для вашей сети, как упоминал Дез, для перемещения данных из левой части этих диаграмм в правую часть этих диаграмм по время. Звучит не так уж и много, но мы видели, как на фабриках заказчиков было десять тысяч датчиков. И если на вашем заводе имеется десять тысяч датчиков, даже если вы просто проводите эти тесты или сигналы один-второй, вы говорите о восьмидесяти четырех тысячах строк данных от каждого из этих отдельных датчиков в день. И поэтому данные определенно накапливаются, и Робин как бы упоминал об этом. Вначале я упомянул пару отраслей, в которых мы видим, что люди получают довольно интересные вещи, используя наше программное обеспечение и данные IoT: автоматизация зданий, энергоснабжение, коммунальные услуги - это действительно важное пространство. Мы видим большую работу, проделанную для оптимизации системы, даже для обслуживания клиентов и, конечно же, для всех операций и технического обслуживания на энергетических объектах и в зданиях для автоматизации. И вот некоторые примеры использования, которые мы видим, довольно мощные.
Мы занимались аналитикой, прежде чем, я думаю, термин был придуман. Как я уже говорил, у нас глубокие корни в Statistica. Компания была основана почти 30 лет назад, поэтому у нас довольно много времени назад появились клиенты, которые интегрировали данные IoT со своей аналитикой и некоторое время занимались этим. И Alliant Energy является одним из наших вариантов использования или эталонных клиентов. И вы можете представить себе проблему энергетической компании с физическим предприятием. Масштабирование за пределами кирпичных стен физического предприятия затруднено, и поэтому энергетические компании, такие как Alliant, ищут способы оптимизации производства энергии, в основном улучшая производственный процесс и оптимизируя его до самого высокого уровня. И они используют Statistica для управления печами на своих заводах. И для всех нас, кто возвращается к нашим ранним дням в научном классе, мы все знаем, что печи производят тепло, тепло производит пар, турбины вращаются, мы получаем электричество. Проблема таких компаний, как Alliant, заключается в том, чтобы на самом деле оптимизировать процесс нагрева и сжигания в этих больших циклонных печах. И оптимизировать выход, чтобы избежать дополнительных затрат на загрязнение, вытеснение углерода и так далее. И поэтому вы должны иметь возможность контролировать внутреннюю часть одной из этих циклонных печей со всеми этими устройствами, датчиками, а затем собирать все эти данные датчиков и вносить изменения в энергетический процесс на постоянной основе. И это именно то, что Statistica делает для Alliant примерно с 2007 года, еще до того, как термин IoT стал очень популярным.
С точки зрения Ребекки, данные, конечно, не новы. Способность обрабатывать и правильно использовать это действительно то, где происходят захватывающие вещи. Сегодня мы немного поговорили о медицинском обслуживании в предварительном звонке, и мы видим все виды приложений для людей, чтобы сделать такие вещи, как улучшение ухода за пациентами, профилактическое обслуживание, управление цепочками поставок и эффективность работы в сфере здравоохранения. И это довольно продолжительно, и есть много разных вариантов использования. Тот, кем мы очень гордимся в Statistica, - это наш клиент Shire Biopharmaceuticals. И Шире производит специальные лекарства для действительно трудно поддающихся лечению заболеваний. И когда они создают партию своих лекарств для своих клиентов, это чрезвычайно дорогой процесс, и этот чрезвычайно дорогой процесс также требует времени. Когда вы думаете о производственном процессе, вы видите, что проблемы объединяются во всех данных, достаточно гибки в отношении различных способов ввода данных в систему, проверки информации и возможности прогнозировать, как мы помогаем этому клиенту. И процессы, которые извлекали большую часть информации из наших производственных систем и, конечно, из устройств и датчиков, которые управляют этими производственными системами. И это отличный пример того, как компании избегают потерь и оптимизируют свои производственные процессы, используя комбинацию данных датчиков, данных IoT и регулярных данных своих процессов.
Итак, вы знаете, хороший пример того, как производство, и особенно высокотехнологичное производство, приносят пользу индустрии здравоохранения в отношении этого вида работ и данных. Я думаю, что у меня есть еще пара моментов, которые я хотел бы сделать, прежде чем завернуть их и вернуть Дезу и Робину. Но вы знаете, я думаю, что эта идея, заключающаяся в том, что вы можете продвигать свою аналитику в любом месте вашей среды, станет чрезвычайно важной для большинства компаний. Привязанность к традиционному формату ETL-данных из источников обратно в центральные местоположения всегда будет иметь место в вашей стратегии, но не должна быть вашей единственной стратегией. Вы должны принять гораздо более гибкий подход к вещам сегодня. Чтобы применить безопасность, о которой я говорил, избегайте обложения налогом вашей сети, чтобы иметь возможность управлять данными и фильтровать их по мере их поступления, а также определять, какие данные стоит хранить в течение длительного времени, какие данные стоит переносить в нашу сеть, или какие данные просто необходимо проанализировать во время их создания, чтобы мы могли принимать наилучшие возможные решения. Такой повсеместный аналитический подход - это то, что мы воспринимаем в Statistica очень близко к сердцу, и это то, к чему мы очень опытны. И это восходит к одному из тех слайдов, которые я упомянул ранее, - возможность экспортировать ваши модели на различные языки, чтобы они могли соответствовать и соответствовать платформам, на которых создаются данные. И, конечно же, наличие устройства распределения для этих моделей, которое мы также представляем на рассмотрение и которое нас очень радует. Я думаю, что разговор сегодня таков: если мы действительно собираемся серьезно относиться к этим данным, которые были в наших системах достаточно долгое время, и мы хотели бы найти конкурентное преимущество и инновационный подход для их использования, вы должны применить некоторые технологии, которые позволяют вам избавиться от некоторых из тех ограничительных моделей, которые мы использовали в прошлом.
Опять же, моя точка зрения заключается в том, что если вы собираетесь использовать IoT, я думаю, что вы должны быть в состоянии сделать это в основе, и ввести данные, сопоставить их с другими данными и провести аналитику. Но также, что не менее важно и, возможно, даже более важно, вы должны обладать такой гибкостью, чтобы размещать аналитику вместе с данными и перемещать аналитику из центральной части вашей архитектуры на край преимуществ, которые я упомянул. перед. Это немного о том, кто мы есть и что мы делаем на рынке. И мы очень взволнованы по поводу IoT, мы думаем, что он определенно достиг совершеннолетия, и у всех здесь есть прекрасные возможности повлиять на свою аналитику и критические процессы с помощью данных такого типа.
Ребекка Джозвиак: Шон, спасибо большое, это была действительно фантастическая презентация. И я знаю, что Дез, вероятно, умирает, чтобы задать вам несколько вопросов, поэтому Дез, я отпущу вас первым.
Дез Бланчфилд: У меня миллион вопросов, но я сдержу себя, потому что знаю, что у Робина тоже будет. Одна из вещей, которую я вижу повсюду, - это вопрос, который поднимается, и я очень хочу получить представление о вашем опыте в этом, учитывая, что вы находитесь в самом сердце вещей. Организации борются с этой проблемой, и некоторые из них только что прочитали «Четвертую промышленную революцию» Клауса Шваба, а затем подверглись панической атаке. А те, кто не знаком с этой книгой, по сути, это идея джентльмена, Клауса Шваба, который, я думаю, является профессором, который является основателем и исполнительным председателем Всемирного экономического форума по памяти, и книга в основном о весь этот вездесущий интернет вещей взрывается и часть влияния на мир в целом. Организации, с которыми я разговариваю, не уверены, должны ли они пойти и модернизировать текущую среду или инвестировать все в создание всей новой среды, инфраструктуры и платформ. В Dell Statistica вы также видите, как люди модернизируют текущие среды и внедряют вашу платформу в существующую инфраструктуру, или вы смотрите, как они переносят свое внимание на создание всей новой инфраструктуры и готовятся к этому потопу?
Шон Роджерс: Вы знаете, у нас была возможность обслуживать оба типа клиентов, и, пока мы на рынке, у вас есть такие возможности, которые расширяются. У нас есть клиенты, которые за последние пару лет создали совершенно новые заводы и оснастили их данными датчиков, IoT, аналитикой от края до конца на протяжении всего этого процесса. Но я должен сказать, что большинство наших клиентов - это люди, которые какое-то время выполняли такую работу, но были вынуждены игнорировать эти данные. Вы знаете, Ребекка прямо об этом заявила: это не новые данные, этот тип информации уже давно доступен во многих различных форматах, но проблема заключалась в том, что к нему подключалась, переместить это, принести это куда-нибудь, где вы могли бы сделать что-то умное с этим.
И поэтому я бы сказал, что большинство наших клиентов смотрят на то, что они имеют сегодня, и Дез, вы уже говорили об этом ранее, что это часть этой революции больших данных, и я думаю, что это на самом деле, это все революция данных, верно? Нам больше не нужно игнорировать определенные системные данные, производственные данные или данные по автоматизации зданий, теперь у нас есть нужные игрушки и инструменты, чтобы получить их, а затем делать с ними умные вещи. И я думаю, что есть много драйверов в этом пространстве, которые делают это, и некоторые из них технологичны. Вы знаете, решения для инфраструктуры больших данных, такие как Hadoop и другие, сделали его немного менее дорогим и немного более легким для некоторых из нас, чтобы думать о создании озера данных такого типа информации. И теперь мы оглядываемся по всему предприятию: «Эй, у нас есть аналитика в нашем производственном процессе, но будут ли они улучшены, если мы сможем добавить некоторое понимание этих процессов?» И это, я думаю, что большинство из наши клиенты делают. Это не столько создание с нуля, сколько расширение и оптимизация уже имеющейся у них аналитики с помощью новых для них данных.
Дез Бланчфилд: Да, в некоторых из крупнейших отраслей промышленности, которые мы видели, вы упомянули о энергетике и коммунальных услугах. Авиация только что пережила этот бум, когда одно из моих самых любимых устройств, о котором я регулярно говорю, Boeing 787 Dreamliner и, конечно, аналог Airbus, A330 пошло по тому же маршруту. В 787 году было выпущено около шести тысяч датчиков, и я думаю, что в новой версии они говорят о пятнадцати тысячах датчиков. И любопытная вещь в разговоре с людьми из этого мира заключалась в том, что идея поместить датчики в крылья и так далее, и удивительная вещь о 787 в платформе дизайна заключается в том, что, вы знаете, они заново изобрели все в самолет. Как и крылья, например, когда самолет взлетает, крылья сгибаются до двенадцати с половиной метров. Но в крайних случаях крылья могут изгибаться на кончике до 25 метров. Эта вещь похожа на хлопающий птицей. Но у них не было времени на исправление, так как они разработали аналитику всех этих данных, поэтому у них есть датчики, которые заставляют светодиоды мигать зеленым и красным, если происходит что-то плохое, но на самом деле они не получают глубокого понимания. в режиме реального времени. И они также не решили проблему перемещения объема данных, потому что во внутреннем воздушном пространстве США ежедневно совершается 87 400 рейсов. Когда каждый самолет догоняет свою покупку 787 Dreamliner, это 43 петабайта данных в день, потому что эти самолеты в настоящее время создают около половины терабайта данных каждый. И если вы умножите эти 87 400 рейсов в день внутри страны в США на целых пять с половиной терабайт, вы получите 43, 5 петабайта данных. Мы физически не можем это передвигать. Таким образом, по замыслу мы должны вытолкнуть аналитику в устройство.
Но одна из вещей, которая интересна, когда я смотрю на всю эту архитектуру - и мне очень интересно узнать, что вы об этом думаете, - это то, что мы перешли к управлению основными данными, своего рода, к первым принципам управления данными, подтягиванию все в центральное место. У нас есть данные, а затем мы создаем небольшие пруды данных, если хотите, выдержки из того, над чем мы проводим аналитику, но путем распространения на грани, одна из вещей, которая продолжает поступать, особенно от сотрудников баз данных и менеджеров данных или люди, занимающиеся управлением информацией, что происходит, когда у меня много маленьких распределенных небольших озер данных? Какие вещи были применены к этому мышлению в отношении аналитики границ в вашем решении, в которой, как правило, все будет централизованно с озером данных, теперь мы получаем эти маленькие лужи данных повсюду, и хотя мы можем выполнять аналитику на них локально, чтобы получить представление о локальных проблемах, с какими проблемами вы столкнулись и как вы их решили, имея этот распределенный набор данных, особенно когда вы получаете микрокосмы озер данных и распределенных областей?
Шон Роджерс: Ну, я думаю, что это одна из проблем, верно? По мере того, как мы уходим, вы знаете, переправляете все данные обратно в центр или к основному аналитическому примеру, который я привел, а затем мы делаем распределенную версию, это то, что вы в конечном итоге получаете все эти маленькие бункеры, верно? Так же, как вы изобразили, верно? Они выполняют небольшую работу, некоторые аналитики работают, но как их объединить? И я думаю, что ключом будет оркестровка всего этого, и я думаю, что вы, ребята, согласитесь со мной, но я рад, если вы этого не сделаете, я думаю, что мы наблюдали за этой эволюцией довольно когда-то.
Возвращаясь к временам наших друзей, г-на Инмона и г-на Кимбалла, которые помогали всем с архитектурой их ранних инвестиций в хранилище данных, суть в том, что мы давно отошли от этой централизованной модели. Мы приняли эту новую идею, позволяющую данным демонстрировать серьезность того, где они лучше всего должны находиться внутри вашей экосистемы, и согласовывать данные с наилучшей возможной платформой для достижения наилучшего возможного результата. И мы начали тратить, как мне кажется, более организованный подход к нашей экосистеме как всеобъемлющий способ ведения дел, как и то, где мы пытаемся выровнять все эти части одновременно. Какой тип аналитики или работы я собираюсь делать с данными, какой это тип данных, это поможет определить, где они должны жить. Где это производится и какой тип гравитации имеют данные?
Вы знаете, мы видим много примеров больших данных, где люди говорят о наличии 10- и 15-петабайтных озер данных. Что ж, если у вас есть такое большое озеро данных, очень непрактично для вас его перемещать, поэтому вы должны иметь возможность использовать аналитику. Но когда вы делаете это, к сути вашего вопроса, я думаю, что возникает много новых проблем для всех, чтобы управлять окружающей средой и применять управление и безопасность, и понимать, что нужно сделать с этими данными, чтобы их курировать и получить наибольшую ценность из этого. И если быть честным с вами - я бы хотел услышать ваше мнение здесь - я думаю, что мы находимся в первых днях, и я думаю, что предстоит еще много хорошей работы. Я думаю, что такие программы, как Statistica, направлены на предоставление доступа к данным большему количеству людей. Мы определенно сосредоточены на этих новых людях, таких как гражданский специалист по данным, которые хотят внедрить прогностическую аналитику в те места внутри организации, которых раньше не было. И я думаю, что это одни из первых дней вокруг этого, но я думаю, что дуга зрелости должна будет продемонстрировать высокий уровень или согласованность и согласованность между этими платформами, а также понимание того, что на них и почему. И это вековая проблема для всех нас, людей данных.
Дез Бланчфилд: Да, действительно, и я полностью согласен с вами в этом, и я думаю, что замечательная вещь, которую мы слышим здесь сегодня, - это, по крайней мере, передний конец проблемы фактического сбора данных на уровне шлюза на границе. сети и способность делать аналитику на этом этапе по существу решена в настоящее время. И теперь это освобождает нас от необходимости думать о следующей задаче - распределенных озерах данных. Большое спасибо за это, это была фантастическая презентация. Я очень ценю возможность поговорить с вами об этом.
Я собираюсь перейти к Робину сейчас, потому что я знаю, что у него есть, и затем Ребекка также получила длинный список замечательных вопросов от аудитории после Робина. Робин?
Доктор Робин Блур: Хорошо. Шон, я бы хотел, чтобы ты сказал немного больше, и я не пытаюсь дать тебе возможность рекламировать это, но на самом деле это очень важно. Мне интересно знать, в какой момент времени Statistica фактически создала возможности экспорта модели. Но я также хотел бы, чтобы вы кое-что сказали о Boomi, потому что все, что вы вроде как говорили о Boomi, это то, что это ETL и действительно ETL. Но на самом деле это достаточно способный ETL, и для тех времен, о которых мы говорим, и некоторых ситуаций, которые мы здесь обсуждаем, это очень важная вещь. Не могли бы вы поговорить с этими двумя вещами для меня?
Шон Роджерс: Конечно, да, я абсолютно могу. Вы знаете, наше движение в этом направлении было, конечно, итеративным, и это был своего рода пошаговый процесс. На следующей неделе мы только готовимся к выпуску версии 13.2 Statistica. И он имеет новейшие обновления всех возможностей, о которых мы говорим сегодня. Но вернемся к Версии 13, год назад, в октябре, мы объявили о своей способности экспортировать модели с нашей платформы и называли ее NDAA. Аббревиатура расшифровывается как Native Distributed Analytics Architecture. Мы потратили много времени, энергии и сосредоточились на том, чтобы открыть нашу платформу с возможностью использовать ее в качестве центрального командного центра для вашей расширенной аналитики, а также для развертывания оттуда. И первые места, Робин, которые мы развернули, мы сделали действительно отличное дополнение к платформе машинного обучения. Таким образом, мы получили возможность развертывания из Statistica в Microsoft Azure Cloud, чтобы использовать возможности Azure для обучения машинным технологиям, как вы знаете, очень интенсивно, и это отличный способ использовать облачные технологии. И это было первым.
Теперь мы экспортировали наши модели в Azure и использовали Azure для их запуска, а затем отправляли данные или результаты обратно на платформу Statistica. А затем мы перешли на другие языки, с которых мы хотели иметь возможность экспортировать, и, конечно, одним из них является Java, что открывает нам возможность теперь экспортировать наши модели в другие места, такие как Hadoop, поэтому он дал мы играем там тоже.
И наконец, мы сосредоточились на том, чтобы иметь возможность выводить наши модели с этим выпуском в базы данных. Итак, это была первая итерация, и, честно говоря, финальной игрой была IoT, но мы еще не были готовы к версии 13 в октябре прошлого года. С тех пор мы добились этого, и это связано со способностью делать все, что я только что упомянул, но затем иметь какое-то транспортное средство. И, возвращаясь к вопросу Деза, знаете, в чем проблема и как мы можем это сделать, когда у нас работает вся эта аналитика? Ну, мы используем Boomi как своего рода распределительный центр, и потому, что он находится в облаке и потому что он настолько мощный, как я уже говорил, это платформа интеграции данных, но это также платформа интеграции приложений, и она использует JVM, чтобы позволить нам парковаться и работать где угодно, где вы можете посадить виртуальную машину Java. Это то, что действительно открыло двери для всех этих шлюзов, периферийных вычислительных платформ и пограничных серверов, потому что у всех из них есть вычислительные возможности и платформа, на которой можно запускать JVM. И поскольку мы можем запустить JVM где угодно, Boomi превратил Это будет замечательный дистрибутив и, используя мои слова из ранее, устройство оркестровки.
И это становится действительно важным, потому что мы все, вы знаете, я думаю, что сценарий самолета минуту назад был отличным, и я упомянул, вы знаете, таких производителей, как Шире, у которых есть десять тысяч датчиков на одном из их заводов, вы Я должен в какой-то момент начать заниматься своего рода центральным подходом к расширенной аналитике. Быть ad hoc об этом больше не работает. Раньше, когда объем используемых нами моделей и алгоритмов был минимальным, сейчас он максимален. В организации их тысячи. Итак, у нас есть часть нашей платформы на основе сервера, и когда у вас есть наше корпоративное программное обеспечение, у вас также есть возможность настраивать, оценивать и управлять своими моделями в среде. И это тоже часть этой оркестровки. Нам нужно было создать слой, Робин, который не только позволил бы вам получить модель там, но и дал вам возможность настраивать модели и заменять их на постоянной основе так часто, как вам нужно, потому что это не то, что вы можете сделать вручную. Вы не можете ходить по нефтеперерабатывающему заводу с помощью флэш-накопителя, пытаясь загрузить модели на шлюзы. Между ними должна быть система транспортировки и управления, поэтому комбинация Statistica и Boomi дает это нашим клиентам.
Доктор Робин Блур: Да. Хорошо, я буду очень краток, но, вы знаете, это заявление, которое было сделано ранее о озере данных и идее накопления петабайтов в любом конкретном месте, и факте, что у него есть гравитация. Знаете, когда вы начали говорить об оркестровке, это только начало наводить меня на мысль о очень простом факте, который заключается в том, что размещение очень большого озера данных в одном месте, вероятно, означает, что вы на самом деле должны его резервировать, и, вероятно, это Вы все равно должны перемещать много данных. Вы знаете, реальная архитектура данных намного больше, на мой взгляд, намного больше в том направлении, о котором вы говорите. То, что нужно распространять в разумных местах, наверное, я бы сказал. И, похоже, у вас есть очень хорошая возможность сделать это. Я имею в виду, что я хорошо проинформирован о Boomi, так что это, так или иначе, почти несправедливо, что я вижу это, и, возможно, аудитория не может. Но Boomi так важен, на мой взгляд, с точки зрения того, что вы делаете, потому что у него есть прикладные возможности. А также потому, что правда в том, что вы не выполняете эти аналитические вычисления, не желая что-то действовать по тем или иным причинам. И Boomi играет роль в этом, верно?
Шон Роджерс: Да, конечно. И, как вы знаете из предыдущих разговоров, в Statistica есть полноценный механизм бизнес-правил. И я думаю, что это действительно важно, когда мы приступим к тому, почему мы это делаем. Вы знаете, я шутил заранее, что на самом деле нет никакой причины делать IoT, если только вы не собираетесь анализировать, использовать данные для принятия лучших решений или принятия мер. И поэтому мы сосредоточились не только на том, чтобы представить модель, а на том, чтобы пометить ее как набор правил. И поскольку Boomi настолько мощен в своих способностях перемещать вещи из одного места в другое, внутри атома Boomi мы также можем встроить способность запускать, предупреждать и предпринимать действия.
И вот где мы начинаем получать такое сложное представление данных IoT, где мы говорим: «Хорошо, эти данные стоит слушать». Но на самом деле, вы знаете, зная, что «свет включен, свет включен, свет включен, свет включен »не так интересно, как то, когда свет гаснет, или когда детектор дыма гаснет, или когда что-то случается с нашим производственным процессом, выходит из-под контроля. Когда это происходит, мы хотим иметь возможность принять немедленные меры. И здесь данные становятся почти вторичными. Поскольку не так важно, чтобы мы сохранили все эти сигналы «все хорошо, все хорошо, все хорошо», важно то, что мы заметили «Привет, это плохо», и мы приняли немедленные меры. Будь то отправка электронного письма кому-либо или мы можем привлечь специалистов в области, или же мы запустили ряд других процессов, чтобы предпринять немедленные действия, будь то корректирующие или в ответ на информацию. И я думаю, что именно поэтому вы должны иметь это организованное представление об этом. Вы не можете просто сосредоточиться на работе с вашими алгоритмами повсеместно. Вы должны быть в состоянии координировать и организовывать их. Вы должны быть в состоянии увидеть, как они работают. И на самом деле, самое главное, я имею в виду, какого чёрта вы сделали бы это, если не можете добавить возможность предпринять какие-то немедленные действия против данных?
Доктор Робин Блур: Хорошо, Ребекка, я полагаю, у вас есть вопросы из зала?
Ребекка Йозвиак: я делаю. У меня тонна вопросов аудитории. Шон, я знаю, что ты не хотел слишком долго задерживаться на часах. Как вы думаете?
Шон Роджерс: Я счастлив. Преуспевать. Я могу ответить на несколько.
Ребекка Йозвиак: Посмотрим. Я знаю одну из вещей, о которых вы упомянули, что IoT находится в раннем возрасте, и у него есть определенная степень зрелости, которая должна произойти, и это как бы говорит на этот вопрос, заданный одним из участников. Если инфраструктура IPv6 будет достаточно устойчивой, чтобы учесть рост IoT в ближайшие пять или десять лет?
Шон Роджерс: О, я позволю Дезу повторить мой ответ, потому что я думаю, что он ближе к такой информации, как я. Но я всегда думал, что мы находимся на очень быстром пути, чтобы согнуть и сломать большинство каркасов, которые у нас есть. И хотя я думаю, что добавление этой новой спецификации или направления, в котором мы идем с инфраструктурами IPv6, важно, и это открывает для нас возможность иметь гораздо больше устройств и иметь возможность отдавать все, что мы хочу дать адрес. Я думаю, что все, что я читаю и вижу со своими клиентами, и количество требуемых адресов, я думаю, в какой-то момент вызовет еще один сдвиг в этом ландшафте. Но я не специалист по сетевым технологиям, поэтому я не могу сказать на сто процентов, что мы в какой-то момент сломаем его. Но мой опыт подсказывает, что в какой-то момент мы нарушим эту модель.
Ребекка Йозвиак: Я не удивлюсь. Я думаю, что фреймворки как бы ломаются под тяжестью разных вещей. И это просто логично, верно? Я имею в виду, вы не можете отправить письмо с пишущей машинкой. Другой участник спрашивает: «Можете ли вы использовать инфраструктуру Hadoop?», Но я думаю, что я мог бы изменить это, чтобы сказать, как бы вы использовали инфраструктуру Hadoop для распределенной аналитики?
Шон Роджерс: Робин сделал мне одолжение, задав мне исторический вопрос, и поэтому, начиная с версии 13, около года назад, для Statistica, мы получили возможность выводить модели из нашей системы в Hadoop. И мы очень тесно сотрудничаем со всеми основными вкусами Hadoop. У нас есть действительно большие истории успеха, связанные с возможностью работать с Cloudera в качестве одного из основных дистрибутивов Hadoop, с которым мы работаем. Но поскольку мы можем выводить данные на Java, это дает нам возможность быть открытыми и размещать нашу аналитику где угодно. Размещение их в кластере Hadoop - это то, что мы делаем для наших клиентов на обычной, регулярной и повседневной основе. Краткий ответ - да, абсолютно.
Ребекка Йозвиак: Отлично. И я просто собираюсь бросить еще один на вас и позволить вам продолжить свой отпуск. Другой участник спрашивает, с точки зрения аналитики IoT и машинного обучения, считаете ли вы, что все данные должны храниться в исторических целях и как это повлияет на архитектуру решения?
Шон Роджерс: Ну, я не думаю, что все данные должны храниться. Но я думаю, что очень интересно иметь возможность развлекать, слушать любой источник данных, который мы хотим в нашей организации, откуда бы он ни исходил. И я действительно думаю, что изменения, которые мы наблюдали на рынке за последние несколько лет, позволили нам использовать подход, основанный на всех данных, и это, похоже, действительно окупается. Но это будет отличаться для каждой компании и каждого варианта использования. Знаете, когда мы смотрим на данные о состоянии здоровья, сейчас возникает множество проблем с нормативными документами, множество проблем с соблюдением требований, и это заставляет нас сохранять данные, которые другие компании могут не понять, зачем их нужно сохранять, верно ? В производственных процессах для многих наших производственных заказчиков есть реальная возможность иметь возможность исторически исследовать ваши процессы и иметь возможность просматривать большие объемы этих данных, чтобы извлечь из них уроки и построить из них лучшие модели.
Я думаю, что многие данные нужно будет хранить, и я думаю, что у нас есть решения, которые делают это более экономичным и масштабируемым сегодня. Но в то же время я думаю, что каждая компания найдет ценность в данных, которые им не нужно хранить на атомарном уровне, но они захотят анализировать их в режиме реального времени и принимать решения на их основе, чтобы стимулировать инновации внутри их компания.
Ребекка Йозвиак: Хорошо, хорошо. Нет, аудитория, я не дошел до всех вопросов сегодня, но я перешлю их Шону, чтобы он мог связаться с вами напрямую и ответить на эти вопросы. Но спасибо всем за участие. Огромное спасибо Шону Роджерсу из Dell Statistica и всем нашим аналитикам, Дезу Бланчфилду и доктору Робину Блуру. Вы можете найти архив здесь, на insideanalysis.com, SlideShare, мы снова начали размещать наши материалы там, и мы обновляем наш YouTube, так что ищите и там. Большое спасибо, ребята. И с этим я прощаюсь с вами, и мы увидимся в следующий раз.