Персонал Техопедии, 19 апреля 2017 г.
Вывод: ведущий Эрик Кавана обсуждает прогнозирование с доктором Робином Блором, Риком Шерманом и Иллиной Буллетт Манале.
Вы должны зарегистрироваться для этого события, чтобы просмотреть видео. Зарегистрируйтесь, чтобы посмотреть видео.
Эрик Кавана: Уважаемые дамы и господа, еще раз привет и добро пожаловать в серию трансляций Hot Technologies! Меня зовут Эрик Кавана, я буду вашим организатором сегодняшнего веб-семинара под названием «Экономия времени, денег и проблем с оптимальными прогнозами». Конечно, я пропустил первую часть заголовка «Лучшие планы». Мы всегда говорите об этом в этом шоу. Таким образом, Hot Technologies, конечно, является нашим форумом для понимания того, какие крутые продукты существуют сегодня в мире, мире корпоративных технологий, что с ними делают люди, как они работают, и тому подобное.
И сегодня тема, как я полагаю, связана с прогнозированием. На самом деле вы пытаетесь понять, что происходит в вашей организации. Как вы собираетесь держать своих пользователей счастливыми, независимо от того, что они делают? Если они проводят анализ, если они выполняют реальную работу, они сталкиваются с реальными клиентами с транзакционными системами, в любом случае, вы хотите понять, как работают ваши системы и что происходит, и это то, что мы » поговорим сегодня. Это довольно забавно, потому что мне не нравится делать прогноз, потому что я суеверен, как будто я думаю, что если я слишком много прогнозирую, произойдут плохие вещи, но это только я. Не следуй моему примеру.
Итак, вот наши докладчики сегодня, ваши действительно в верхнем левом углу, Рик Шерман звонит из Бостона, наш приятель Буллет Манале из IDERA и наш собственный доктор Робин Блур. И с этим я передам это Робину и просто напомню людям: задавайте вопросы, не стесняйтесь, мы любим хорошие вопросы, мы передадим их нашим докладчикам и другим сегодня. И с этим, Робин, забери это.
Робин Блур: Хорошо, так как я нахожусь в поул-положении, как они говорят, я подумал, что расскажу историю SQL сегодня, потому что это фон, на котором будет проходить обсуждение, и оно неизбежно не столкнется с потому что Рик не фокусируется на этом, и не будет противоречить тому, что должен сказать Рик. Итак, история SQL, есть некоторые интересные вещи о SQL, потому что он настолько доминирующий. Видите ли, это опечатка, SQL является декларативным языком. Идея заключалась в том, что вы могли бы создать язык, на котором вы бы запрашивали то, что хотели. И база данных будет работать, как ее получить. И, на самом деле, это неплохо сработало, но есть несколько вещей, которые стоит сказать об этом, последствия того, чтобы основать всю ИТ-индустрию на декларативном языке. Пользователь не знает и не заботится о физической организации данных, и это хорошо в декларативном языке - он отделяет вас от всего этого и даже беспокоится об этом - просто спрашивайте, что вы хотите, и базу данных пойду и возьму это.
Но пользователь не имеет представления, повлияет ли способ, которым они структурируют SQL-запрос, на производительность запроса, и это немного наоборот. Я видел запросы длиной в сотни и сотни строк, которые, как вы знаете, представляют собой всего один SQL-запрос, начинающийся с «select» и просто продолжающийся с подзапросами и так далее, и так далее. И на самом деле получается, что если вы хотите получить определенный набор данных из базы данных, вы можете запросить его разными способами с помощью SQL и получить тот же ответ, если вы как-то знакомы с данными. Таким образом, один SQL-запрос не обязательно является лучшим способом запроса данных, и базы данных будут реагировать совершенно по-разному в зависимости от того, какой SQL-код вы в них вставили.
Итак, SQL на самом деле влияет на производительность, поэтому люди, которые используют SQL, это верно для них, это также верно для программистов SQL, которые используют SQL, и они еще реже думают о влиянии, которое они будут иметь, потому что большая часть их сосредоточена на манипулировании данными, а не на получении, размещении данных. И то же самое относится и к инструментам BI, я видел SQL, который вытесняет, если хотите, инструменты BI различных баз данных, и нужно сказать, что многое из этого, ну, я бы не написать такие SQL-запросы. Кто-то создал, если хотите, маленький моторчик, который, какими бы ни были параметры, выбрасывает некоторый SQL, и снова, что SQL не обязательно будет эффективным SQL.
Затем я подумал упомянуть несоответствие импеданса: данные, которые используют программисты, отличаются от данных в том виде, в котором они сортируются. Итак, наша DMS хранит данные в таблицах, организованные объектно-ориентированный код в основном являются кодерами, в настоящее время программируют объектно-ориентированные формы и упорядочивают данные в объектных структурах, поэтому они не отображаются друг на друга. Таким образом, необходимо перевести то, что программист думает о данных, в то, что база данных думает о том, что это за данные. Похоже, что мы сделали что-то не так, чтобы это было так. У SQL есть DDL для определения данных, у него есть DML - язык манипулирования данными - выберите, спроецируйте и объедините, чтобы получить эти данные. Сейчас очень мало математики и очень мало времени, так что это несовершенный язык, хотя нужно сказать, что он был расширен и продолжает расширяться.
А затем возникает проблема с барьером SQL, которая всегда более прямолинейна, чем диаграмма, в которой многие люди задают вопросы по аналитическим причинам, как только они получают ответ на термины данных вопроса, хотят задать еще один вопрос. Таким образом, это становится диалогом, ну, SQL не был создан для диалогов, он был создан для того, чтобы спрашивать, что вы хотите сразу. И это стоит знать, потому что есть некоторые продукты, которые на самом деле отказываются от SQL, чтобы сделать возможной беседу между пользователем и данными.
С точки зрения производительности базы данных - и этот вид распространяется на все - да, есть ЦП, есть память, есть диск, есть сетевые накладные расходы и есть проблема блокировки более чем одного человека, желающего использовать данные исключительно на заданном уровне. момент времени. Но есть и плохие вызовы SQL, и очень много можно сделать, если вы действительно оптимизируете SQL с точки зрения производительности. Итак, факторы производительности базы данных: плохой дизайн, плохой дизайн программы, параллелизм отсутствия рабочей нагрузки, балансировка нагрузки, структура запросов, планирование емкости. Это рост данных. И в двух словах, SQL удобен, но не самооптимизируется.
Сказав это, я думаю, мы можем перейти к Рику.
Эрик Кавана: Хорошо, Рик, позволь мне дать тебе ключи от машины WebEx. Унеси это.
Рик Шерман: Хорошо, отлично. Что ж, спасибо Робину, когда мы начали в начале презентации, моя графика все еще довольно скучная, но мы пойдем с этим. Итак, я согласен со всем, о чем говорил Робин на стороне SQL. Но сейчас я хочу немного сконцентрироваться на спросе на данные, которые мы очень быстро рассмотрим, на поставке, как в инструментах, используемых в этом пространстве, или на потребности в инструментах в этом пространстве.
Во-первых, в каждой статье, которую вы читаете, есть что-то, касающееся больших данных, большого количества данных, неструктурированных данных, поступающих из облака, больших данных везде, которые вы можете себе представить. Но рост рынка баз данных постоянно идет с SQL, реляционные базы данных, вероятно, по состоянию на 2015 год, по-прежнему 95 процентов рынка баз данных. На долю трех ведущих поставщиков реляционных услуг приходится около 88% рынка. Итак, мы все еще говорим, как говорил Робин, о SQL. И на самом деле, даже если мы смотрим на платформу Hadoop, Hive и Spark SQL - который мой сын, ученый по данным, использует сейчас все время, - безусловно, является основным способом получения людьми доступа к данным.
Теперь, на стороне базы данных, есть две широкие категории использования баз данных. Один из них касается операционных систем управления базами данных, таких как планирование корпоративных отношений, управление отношениями с клиентами, ERP-системы Salesforce, Oracle, EPIC, N4 и т. Д. В мире. Кроме того, существует огромное количество данных, которые находятся в хранилищах данных и других системах на основе бизнес-аналитики. Потому что все, независимо от того, где и как оно захвачено, хранится или передается, в конечном итоге анализируется, и поэтому существует огромный спрос и увеличение использования баз данных, особенно реляционных баз данных на рынке.
Теперь у нас есть спрос, мы получаем огромное количество данных. И я на самом деле говорю не только о больших данных, я говорю об использовании данных во всех видах предприятий. Но в дополнение к этому, с точки зрения предложения, для людей, которые могут управлять этими ресурсами, у нас есть прежде всего недостаток DBA. По данным Бюро статистики труда, в 2014–2024 гг. Рабочие места DBA будут только расти на 11 процентов - теперь это люди, имеющие должности DBA, но об этом мы поговорим через секунду - по сравнению с 40- плюс годовой объем роста данных. И у нас много администраторов баз данных; в среднем в том же исследовании говорилось о том, что средний возраст довольно высок по сравнению с другими ИТ-профессиями. И затем у нас много людей, покидающих поле, не обязательно уходящих в отставку, но переходящих в другие аспекты, переходящих в управление или что-то еще.
Теперь одна из причин, по которой они уходят, заключается в том, что работа DBA становится все сложнее и сложнее. Во-первых, у нас есть администраторы баз данных, которые сами управляют многими различными базами данных, физическими базами данных, расположенными повсеместно, а также различными типами баз данных. Теперь это могут быть реляционные или другие типы баз данных. Но даже если он реляционный, у них может быть один, два, три, четыре разных поставщика, которыми они на самом деле пытаются управлять. Администраторы базы данных обычно участвуют после разработки базы данных или приложения. Робин рассказал о том, как создаются базы данных или приложения, как создается SQL. Ну, когда мы говорим о моделировании данных, моделировании ER, расширенном моделировании ER, моделировании измерений, расширенном моделировании измерений, что бы то ни было, обычно программисты приложений и разработчики приложений проектируют с учетом своей конечной цели - они не проектируют для эффективности сама структура базы данных. Так что у нас много плохого дизайна.
Я не говорю о поставщиках коммерческих приложений для предприятий; у них обычно есть модели ER или расширенные модели ER. Я говорю о том, что разработчики приложений в каждой компании создают гораздо больше бизнес-процессов и приложений - они не обязательно предназначены для эффективности или результативности развертывания. А сами администраторы баз данных перегружены работой, и иногда они несут круглосуточную ответственность, все больше и больше получая базы данных. Я думаю, что это немного связано с тем, что люди не совсем понимают, что они делают или как они это делают. Их собственная небольшая группа и люди просто продолжают думать: «Ну, все эти инструменты настолько просты в использовании, что мы можем просто использовать все больше и больше баз данных для их рабочей нагрузки», что не так.
Что приводит нас к неполной занятости и случайным администраторам баз данных. У нас есть небольшие ИТ-команды, и они не могут позволить себе выделенного администратора баз данных. Это относится и к малым и средним предприятиям, где расширение базы данных и приложений баз данных резко возросло за последнее десятилетие и продолжает расширяться. Но это также относится и к крупным корпорациям, которые долгое время занимались аналитикой бизнес-аналитики и хранилищами данных. Давным-давно мы получали специальных администраторов для этих проектов; мы больше никогда не получим выделенного администратора. Мы отвечаем за разработку базы данных, и это хорошо, если у кого-то есть опыт. Но в целом администраторы баз данных являются разработчиками приложений, они часто принимают эту роль в качестве части неполного рабочего дня, у них нет формального обучения этому и снова, они разрабатывают это для своих конечных целей, они не разрабатывая это для эффективности.
И есть большая разница между проектированием и разработкой, в отличие от развертывания и управления. Таким образом, у нас есть «мудрый пенни, глупый фунт» с маленькой копилкой, пропускающей получение навыков и ресурсов, необходимых для проектов. Думая, что все из «Мести полудурков», моя маленькая картинка там. Теперь, что касается потребностей людей, мы расширили использование баз данных и данных в SQL. У нас ограниченное количество администраторов баз данных - людей, которые являются опытными и опытными в этих настройках, проектировании, управлении и развертывании. И у нас появляется все больше и больше неполных или случайных администраторов баз данных, людей, у которых не было формального обучения.
Итак, каковы другие вещи, которые также затрагивают тот факт, что эти базы данных также не настраиваются и не управляются? Во-первых, многие люди предполагают, что сами системы баз данных имеют достаточно инструментов для управления собой. Теперь инструменты становятся все проще и проще - проектирование и разработка - но это отличается от создания хорошего дизайна и хорошего управления, планирования емкости, мониторинга и т. Д. Для развертывания. Итак, во-первых, люди предполагают, что у них есть все необходимые инструменты. Во-вторых, если вы работаете неполный рабочий день или случайный администратор баз данных, вы не знаете, чего не знаете.
Я думаю, что я забыл некоторые фразы там, так что часто они просто не понимают, что им даже нужно посмотреть в дизайне или когда они управляют или управляют базами данных. Если это не ваша профессия, тогда вы не поймете, что вам нужно делать. Третий - это то, что SQL - инструмент для перехода, поэтому Робин говорил о SQL и о том, как плохо SQL иногда создается или часто создается. Кроме того, одна из моих любимых задач в области хранилищ данных BI, миграции данных, пространства для разработки данных заключается в том, что вместо использования инструментов люди склонны писать код SQL, хранимые процедуры, даже если они используют дорогой инструмент интеграции данных или дорогой инструмент BI, они часто действительно используют его только для запуска хранимых процедур. Так что важность понимания проектирования баз данных, построения SQL становится все более и более важной.
И, наконец, существует такой подход, в котором отдельные люди смотрят на отдельные базы данных. Они не смотрят на то, как работают приложения, и взаимодействуют друг с другом. И они также часто смотрят на базы данных по сравнению с приложениями, для которых они их используют. Итак, рабочая нагрузка, которую вы получаете на базу данных, критически важна при проектировании, критически важна при ее настройке, критически важна при попытке выяснить, как планировать емкость и т. Д. Итак, глядя на лес с деревьев, люди оказываются в сорняках, глядя на отдельные таблицы и базы данных и не глядя на общее взаимодействие этих приложений в рабочей нагрузке.
Наконец, люди должны взглянуть на ключевые области, на которые им нужно обратить внимание. Когда они планируют управлять базами данных, им нужно сначала подумать о разработке некоторых метрик производительности, ориентированных на приложения, поэтому им нужно посмотреть не только на то, как эта таблица структурирована, как она конкретно моделируется, но как она используется? Итак, если у вас есть корпоративное приложение, предназначенное для управления цепочками поставок, если вы принимаете заказы из Интернета, если вы занимаетесь бизнес-аналитикой - чем бы вы ни занимались - вам нужно посмотреть, кто ее использует, как они используя его, каковы объемы данных, когда это произойдет. То, что вы действительно пытаетесь найти, - это время ожидания, потому что, несмотря ни на что, все приложения оцениваются по тому, сколько времени потребуется, чтобы что-то сделать, будь то человек или просто обмен данными между приложениями или процессорами. И какие узкие места? Так часто, когда вы пытаетесь отладить проблемы, конечно, вы действительно пытаетесь понять, что является настоящими узкими местами - не обязательно, как настроить все, но как избавиться от этого и повысить производительность, увеличив время ожидания. и пропускная способность - все, что вам нужно посмотреть.
И вам действительно необходимо отделить сбор данных, транзакции, аспекты преобразований в базе данных вместе с аналитикой. Каждый из них имеет разные шаблоны проектирования, каждый из них имеет разные шаблоны использования, и каждый из них должен быть настроен по-разному. Итак, вам нужно подумать о том, как используются эти данные, когда они используются, для чего они используются, и выяснить, какие показатели производительности и какие ключевые моменты вы хотите проанализировать, связанные с этим использованием. Теперь, когда вы смотрите на мониторинг производительности, вы хотите посмотреть на сами операции с базой данных; вы хотите рассмотреть как структуры данных, так и индексы, разбиение и другие физические аспекты базы данных, даже структуру базы данных - будь то модель ER или модель измерений, как бы она ни была структурирована - все эти факторы влияют на производительность особенно в различных контекстах аналитики сбора данных и происходящих преобразований.
И, как упоминал Робин на стороне SQL, очень важно посмотреть на SQL, который запускается этими различными приложениями в этих базах данных, и настроить его. И, глядя на общую нагрузку приложений и инфраструктуру среды, в которой работают эти базы данных и приложения. Таким образом, чтобы сети, серверы, облако - независимо от того, на чем они работают, - также рассматривали влияние, которое эти приложения и эти базы данных оказывают в этом контексте, все они имеют возможность настраивать базу данных.
И, наконец, когда вы смотрите на инструменты, вы хотите иметь возможность взглянуть на три различных вида аналитики, связанных с этим. Вы хотите взглянуть на описательный анализ: что и где происходит, связано с базой данных и производительностью приложения. Вы хотите иметь возможность проводить диагностическую аналитику, чтобы выяснить не только то, что происходит, но и почему, где узкие места, где проблемы, что хорошо, что плохо? Но вы можете анализировать и анализировать проблемные области, чтобы решать их, будь то дизайн или все, что вам нужно сделать.
И, наконец, самый агрессивный или проактивный тип анализа - это на самом деле сделать некоторый прогнозный анализ, моделирование прогнозной аналитики, что угодно. Мы знаем, что база данных и приложения работают в этом контексте, если мы увеличим пропускную способность, если мы получим больше пользователей, если мы увеличим пропускную способность, что бы мы ни делали, имея возможность прогнозировать, что, как и где это будет Влияние на базу данных, приложения, позволяет нам планировать и заблаговременно выяснять, где находятся узкие места, где может пострадать время ожидания и что нам нужно сделать, чтобы все исправить. Поэтому мы хотим иметь инструменты, способные реализовывать метрики производительности, отслеживать производительность, как и в случае этих трех типов анализа. И это мой обзор.
Эрик Кавана: Хорошо, позвольте мне передать это - между прочим, это две отличные презентации - позвольте мне передать это Буллетту Манале, чтобы они взяли его оттуда. И люди, не забудьте задать хорошие вопросы; у нас уже есть хороший контент. Убери это, Буллетт.
Bullett Manale: звучит хорошо. Спасибо, Эрик. Итак, многое из того, что сказали Рик и Робин, очевидно, я согласен со 100%. Я бы сказал, что я поднял этот слайд, потому что я думаю, что это уместно, я не знаю, для тех из вас, кто является фанатами «A-Team» еще в 80-х, у Джона Ганнибала Смита было высказывание, что он всегда говорят: «Мне нравится, когда план собирается вместе», и я думаю, что когда вы говорите, в частности, о SQL Server, на котором мы фокусируемся, - о продукте, о котором мы собираемся поговорить сегодня, SQL Diagnostic Manager, это определенно одна из тех вещей, которые вам нужны; вы должны иметь возможность использовать имеющиеся у вас данные и принимать решения на основе этих данных, а в некоторых случаях вы не ищете решения; Вы ищете что-то, что скажет вам, когда что-то исчерпает ресурсы, когда вы исчерпаете ресурсы, когда у вас будет узкое место, такие вещи.
Это не просто мониторинг конкретной метрики. Итак, с помощью Diagnostic Manager одна из вещей, которые он делает очень хорошо, поможет вам с точки зрения прогнозирования и понимания конкретных нагрузок, и сегодня мы поговорим об этом. Инструмент предназначен для менеджера данных, администратора баз данных или действующих администраторов баз данных, поэтому многие вещи, о которых упоминал Рик, действующие администраторы баз данных настолько правдивы. Во многих случаях, если вы не администратор базы данных, у вас будет много вопросительных знаков, когда вы будете иметь дело с управлением средой SQL, чего вы не знаете. И поэтому вы ищете что-то, чтобы помочь вам, провести вас через этот процесс, а также обучить вас в этом процессе. И поэтому важно, чтобы инструмент, который вы используете для такого рода решений, дал вам некоторое представление о причинах принятия таких решений, а не просто говорил вам: «Эй, сделай это».
Поскольку я действующий администратор баз данных, в конце концов я мог бы стать полноценным администратором баз данных с фактическим опытом и знаниями, подтверждающими этот титул. Итак, это говорит о том, что когда мы говорим о том, чтобы быть администратором базы данных - я всегда сначала показываю этот слайд, потому что администратор базы данных играет несколько разные роли и в зависимости от организации, с которой вы работаете, вы будете иметь, они будут варьироваться от одного места к другому, но, как правило, вы всегда будете в какой-то мере отвечать за свое хранилище, свое планирование этого хранилища и понимание предвидения, я должен сказать, сколько места вы собираетесь нужно, будь то для ваших резервных копий, или для самих баз данных. Вам нужно будет понять и оценить это.
Кроме того, вам понадобится уметь понимать и оптимизировать вещи по мере необходимости, и, проходя мониторинг среды, очевидно, что вы должны вносить изменения по мере необходимости, основываясь на вещах, изменить в самой среде. Таким образом, такие вещи, как количество пользователей, такие как популярность приложений, сезонность базы данных, должны учитываться при прогнозировании. И затем, очевидно, рассматривая другие вещи с точки зрения возможности предоставления отчетов и информации, необходимой для принятия этих решений. Во многих случаях это означает проведение сравнительного анализа; это означает, что у вас есть возможность посмотреть на конкретную метрику и понять, какова была ценность этой метрики с течением времени, чтобы вы могли предвидеть, куда она пойдет дальше.
Так что у многих инструментов Diagnostic Manager есть эти возможности, и люди используют его каждый день для выполнения таких задач, как прогнозирование, и я привел здесь определение планирования мощности. И это довольно широкое и на самом деле довольно расплывчатое определение, которое представляет собой просто процесс определения производственных мощностей, необходимых организации для удовлетворения меняющихся потребностей в ее продуктах, и, в конце концов, это действительно то, о чем все это: о возможности получения информации, которая у вас есть, так или иначе, и принятия этой информации и принятии решений, которые помогут вам двигаться вперед по мере продвижения по жизненному циклу ваших баз данных. Итак, типы вещей, которые являются причинами, почему люди должны делать это, очевидно, в первую очередь, в большинстве случаев, чтобы сэкономить деньги. Бизнес, очевидно, что их главная цель - зарабатывать деньги и экономить деньги. Но вместе с этим, это также означает, что вы можете быть уверены, что время простоя не будет. И способность быть уверенным в том, что вы минимизируете вероятность возникновения простоев, поэтому не допускайте, чтобы это происходило с самого начала, другими словами, не ожидая, пока это произойдет, а затем отреагировав на него.
Помимо общей возможности повысить производительность ваших пользователей, очевидно, что ключом к этому является то, что они делают их более эффективными, чтобы вы могли делать больше бизнеса, так что это такие вещи, которые, как администратор БД или кто-то, кто вовлечен в прогнозирование или потенциал Планирование должно быть в состоянии разбираться с информацией, чтобы иметь возможность принимать эти решения. И затем, в целом, это, очевидно, поможет вам избавиться от лишних затрат, не только с точки зрения денег, но также с точки зрения времени и просто ресурсов, которые могут быть использованы для других целей, возможно. Таким образом, возможность устранить эти отходы, чтобы у вас не было альтернативных издержек, связанных с самими отходами.
Итак, с учетом сказанного, какие типы вопросов мы получаем, специфичные для человека, который является администратором базы данных? Когда я выбегу из космоса? Это большой вопрос, не только, сколько места я сейчас потребляю, но и когда я закончу, основываясь на тенденциях и прошлой истории? То же самое с реальными экземплярами SQL, базами данных, какие серверы я могу консолидировать? Я собираюсь разместить некоторые на виртуальных машинах, что имеет смысл с точки зрения того, какие базы данных я собираюсь консолидировать и на каких экземплярах SQL они должны находиться? На все эти типы вопросов нужно ответить. Потому что в большинстве случаев, если вы DBA или действующий DBA, вы собираетесь консолидировать это когда-нибудь в своей карьере. Во многих случаях вы будете делать это на постоянной основе. Таким образом, вы должны быть в состоянии быстро принимать эти решения, а не играть в угадайку, когда дело доходит до этого.
Мы говорили о «узких местах» и о том, где они будут происходить дальше, имея возможность предвидеть это снова, вместо того, чтобы ждать их возникновения. Итак, очевидно, что все эти вещи, о которых мы говорим, имеют смысл в том смысле, что вы полагаетесь на исторические данные, в большинстве случаев, чтобы иметь возможность генерировать эти рекомендации или в некоторых случаях самостоятельно формулировать решения, чтобы иметь возможность придумать эти ответы. Но это напоминает мне о том, что когда вы слышите рекламу по радио о ком-то, кто продает ценные бумаги или что-то в этом роде, это всегда «прошлые результаты не свидетельствуют о будущих результатах» и тому подобное. И то же самое здесь верно. Вы будете иметь ситуации, когда эти прогнозы и эти анализы могут быть не на 100 процентов правильными. Но если вы имеете дело с вещами, которые произошли в прошлом и известном, и у вас есть возможность взять и сделать «что, если» со многими из этих типов вопросов, с которыми вы столкнетесь, это очень ценно и это продвинет вас намного дальше, чем игра в угадайку.
Итак, эти типы вопросов, очевидно, будут возникать, поэтому, как мы решаем многие из этих вопросов с помощью Diagnostic Manager, в первую очередь, у нас есть возможности прогнозирования, и мы можем делать это и в базе данных, и за столом. как диск или объем. Чтобы иметь возможность не только сказать: «Эй, у нас полно места», но и через шесть месяцев, через два года, через пять лет, если я на это рассчитываю, сколько места у меня уходит нужно бюджет для? Это вопросы, которые мне нужно будет задать, и мне нужно будет иметь возможность использовать какой-то метод, вместо того, чтобы угадывать и поднимать палец вверх и ждать, чтобы увидеть, куда дует ветер, К сожалению, во многих случаях принимается много таких решений.
В дополнение к этому, возможность - похоже, что мой слайд немного обрезался - но была возможность оказать некоторую помощь в виде рекомендаций. Итак, одно дело - иметь возможность показать вам панель, полную метрик, и сказать: «Хорошо, вот все метрики и где они находятся», но затем иметь возможность сделать некоторые или иметь некоторое представление о что делать, исходя из этого еще один скачок. А в некоторых случаях люди достаточно образованы в роли администратора баз данных, чтобы принимать такие решения. И поэтому у нас есть некоторые механизмы в инструменте, которые помогут с этим, который мы покажем вам через секунду. Но будучи в состоянии показать не только, что это за рекомендация, но и дать некоторое представление о том, почему эта рекомендация была сделана, а также, кроме того, в некоторых случаях, возможность фактически создать сценарий, который автоматизирует исправление этой проблемы также идеально.
Переходя к следующему здесь, который мы увидим, это просто общее понимание понимания до метрического уровня, что является нормальным. Я не могу сказать вам, что не нормально, если я не знаю, что нормально. И так, имея какой-то способ измерить это является ключевым, и вы должны иметь возможность принимать во внимание различные типы областей, например - или, я бы сказал, временные рамки - различные группы серверов, которые могут делать это динамически, другими словами, с точки зрения предупреждения, в середине ночи, во время моего периода обслуживания, я ожидаю, что мой ЦП будет работать на 80% на основе всего текущего обслуживания. Итак, я мог бы хотеть увеличить свои пороги выше, в те временные рамки по сравнению с, может быть, в середине дня, когда у меня не так много активности.
Это некоторые вещи, которые, очевидно, будут экологическими, но вещи, которые вы можете применить к тому, что управляется, чтобы помочь вам более эффективно управлять этой средой и упростить это. Другая область, очевидно, заключается в возможности просто предоставлять отчеты и информацию, чтобы иметь возможность ответить на такие вопросы типа «что если». Если я только что внес изменения в свою среду, я хочу понять, как это повлияло, чтобы я мог применить это же изменение к другим экземплярам или другим базам данных в моей среде. Я хочу, чтобы у меня была какая-то информация или боеприпасы, чтобы сделать это изменение с некоторым спокойствием и осознанием того, что это будет хорошее изменение. Итак, возможность составлять такую сравнительную отчетность, иметь возможность ранжировать мои экземпляры SQL, иметь возможность сравнивать мои базы данных друг с другом, говоря: «Какой мой самый высокий потребитель ЦП?» Или какой из них занимает больше всего времени в сроки ожидания и тому подобное? Так что большая часть этой информации также будет доступна с помощью инструмента.
И, наконец, последнее, но не менее важное, это просто общая способность, что вам нужен инструмент, который сможет справиться с любой ситуацией, которая возникнет у вас на пути, и вот что я имею в виду, если у вас большая среда с Во многих случаях вы, вероятно, столкнетесь с ситуациями, когда вам нужно получить метрики, которые традиционно не являются метриками, которые администратор БД хотел бы даже отслеживать в некоторых случаях, в зависимости от конкретной ситуации. Таким образом, имея инструмент, который вы можете, который можно расширить, чтобы иметь возможность добавлять дополнительные метрики и иметь возможность использовать эти метрики в той же форме и в той же манере, что вы использовали бы их, если бы вы использовали "из коробки" метрика, например. Таким образом, способность создавать отчеты, возможность оповещения, исходные данные - все то, о чем мы говорим, - также является ключевой частью способности делать это прогнозирование и делать его таким образом, чтобы вы получали ответы, которые вы ищете быть в состоянии принимать эти решения, двигаясь вперед.
Теперь, когда Diagnostic Manager делает это, у нас есть централизованная служба, группа служб, которая выполняет сбор данных по экземплярам с 2000 по 2016 год. И затем мы берем эти данные и помещаем их в центральный репозиторий, а затем, очевидно, что мы будем делать с этими данными, мы делаем много, чтобы иметь возможность обеспечить дальнейшее понимание. Теперь, в дополнение к этому - и одна из вещей, которых здесь нет - это то, что у нас также есть служба, которая работает среди ночи, которая является нашей службой прогнозного анализа, которая выполняет некоторые вычисления и помогает понять и помочь вам как администратору БД или действующему администратору баз данных, чтобы иметь возможность давать рекомендации такого типа, чтобы иметь возможность дать некоторое представление о базовых показателях.
Итак, что я хотел бы сделать, и это всего лишь быстрый пример архитектуры, большой вывод здесь заключается в том, что нет никаких агентов или сервисов, которые на самом деле сидят в экземплярах, которыми вы управляете. Но то, что я хотел бы сделать, это просто взять вас в приложение здесь и дать вам короткую демонстрацию. И позвольте мне тоже выйти и сделать это. Итак, дай мне знать, я думаю, Эрик, ты видишь, что все в порядке?
Эрик Кавана: Я понял это сейчас, да.
Bullett Manale: Хорошо, я собираюсь рассказать вам о некоторых из этих частей, о которых я говорил. И, по сути, давайте начнем с того, что больше похоже на то, что вам нужно сделать, или это то, что является моментом времени в будущем, и мы собираемся дать вам некоторое представление об этом. И это способность действительно предвидеть - или я должен сказать, динамически предвидеть - вещи, как они происходят. Теперь, в случае отчетов, в инструменте есть три разных прогнозных отчета. И в случае, например, прогноза базы данных, что я, вероятно, сделал бы в ситуации, когда я смогу предвидеть размер базы данных в течение определенного периода времени, и я просто дам вам пару примеров этого, Итак, я собираюсь взять свою базу данных аудита, которая довольно интенсивно вводит / выводит - в нее поступает много данных. У нас есть, давайте посмотрим, мы сделаем это здесь, и давайте просто выберем базу данных здравоохранения здесь.
Но дело в том, что я не просто вижу, сколько места для этого, я могу сказать: «Послушайте, давайте возьмем данные за прошлый год» - и я собираюсь немного выдумать, У меня на самом деле нет данных за год, у меня есть данные за два месяца - но, поскольку я выбираю здесь частоту выборки месяцев, я буду в состоянии предвидеть или прогнозировать в этом на случай следующих 36 единиц, потому что наша частота выборки установлена на месяцы, то есть на единицу, на месяц, и тогда я смогу, а затем запустить отчет, который в основном покажет мне, где мы ожидаем наш будущий рост, для этих три базы данных. И мы можем видеть, что мы имеем различную степень различий или различий между тремя различными базами данных, в частности, в зависимости от объема данных, которые они потребляли исторически.
Мы можем видеть, что точки данных здесь представляют исторические данные, а затем линия предоставит нам прогноз, а также цифры, подтверждающие это. Таким образом, мы можем сделать это на уровне таблицы, мы можем сделать это даже на уровне дисков, где я могу предвидеть, насколько большими будут мои диски, включая точки монтирования. Мы могли бы прогнозировать этот же тип информации, но еще раз, в зависимости от частоты выборки, я смогу определить, сколько единиц и где мы берем то, что мы хотим прогнозировать. Обратите внимание, что у нас есть разные типы прогнозов. Таким образом, вы получаете множество вариантов и гибкость, когда дело доходит до прогнозирования. Это одна вещь, которую мы сделаем, фактически предоставив вам конкретную дату и возможность сказать: «Эй, в эту дату, это то место, где мы ожидаем рост ваших данных». В дополнение к этому, мы можем предоставить вам другую информацию, связанную с анализом, который мы проводим в нерабочее время, и обслуживанием, когда он выполняется. Некоторые из вещей, которые он делает, это то, что он пытается предвидеть то, что, скорее всего, произойдет, основываясь на истории того, что происходило в прошлом.
Таким образом, мы можем видеть здесь, на самом деле, прогноз дает нам некоторое представление о вероятности возникновения у нас проблем в течение вечера, основанных на событиях, которые снова произошли в прошлом. Итак, очевидно, что это здорово, особенно если я не администратор баз данных, я могу смотреть на эти вещи, но что еще лучше, если я не администратор баз данных, это вкладка анализа. Итак, до того, как это было здесь в инструменте, мы должны были пройти и показать продукт людям, и они сказали бы: «Это здорово, я вижу все эти цифры, я вижу все, но я не знаю, что делать» (смеется). «В результате этого». Итак, то, что мы имеем здесь, это лучший способ для вас понять, если я собираюсь принять меры, чтобы помочь с производительностью, если я собираюсь предпринять действия, чтобы даже помочь мне в состоянии здоровья, иметь возможность предоставить эти рекомендации, а также полезные советы по информации, чтобы узнать больше об этих рекомендациях и даже иметь внешние ссылки на некоторые из этих данных, которые покажут мне и Приведите меня к причинам, по которым сделаны эти рекомендации.
И во многих случаях, будучи в состоянии предоставить сценарий, который автоматизировал бы, как я сказал, исправление этих проблем. Теперь, часть того, что мы делаем здесь с этим анализом - и я покажу вам, когда я войду, чтобы настроить свойства этого экземпляра, и я перейду к разделу конфигурации анализа - у нас есть много различных категорий, которые перечисленные здесь, и часть этого, у нас есть оптимизация индекса и оптимизация запросов. Итак, мы оцениваем не только сами метрики и тому подобное, но и такие вещи, как рабочие нагрузки и индексы. В данном случае мы на самом деле проведем дополнительный гипотетический анализ индекса. Так что это одна из тех ситуаций, когда я не хочу, во многих случаях я не хочу добавлять индекс, если мне это не нужно. Но в какой-то момент есть своего рода переломный момент, когда я говорю: «Ну, таблица достигает размера или типы запросов, которые выполняются в рабочей нагрузке, имеют смысл сейчас добавить индекс. Но это не имело бы смысла, может быть, за шесть недель до этого ». Таким образом, это позволяет вам динамически получить представление о вещах, которые, вероятно, как я уже сказал, улучшат производительность на основе того, что происходит в среде, что происходит в рабочих нагрузках. и делать такие вещи.
И поэтому вы получаете много полезной информации здесь, а также возможность автоматически оптимизировать эти вещи. Итак, это еще одна область, в которой мы могли бы помочь, с точки зрения того, что мы называем предиктивным анализом. Теперь, в дополнение к этому, я должен сказать, что у нас есть и другие области, которые, как мне кажется, в целом пригодны для оказания вам помощи в принятии решений. И когда мы говорим о принятии решений, еще раз, имея возможность взглянуть на исторические данные, предоставим некоторую информацию, которая поможет нам понять, где мы должны быть, чтобы улучшить эту производительность.
Теперь, одна из вещей, которые мы можем сделать, - у нас есть базовый визуализатор, который позволяет нам выборочно выбирать любую метрику, которую мы хотели бы - и позвольте мне найти приличную метрику - я собираюсь использовать процессор SQL, но дело в том, что вы Вы можете вернуться к тому же на многие недели, чтобы нарисовать эти картинки, чтобы вы могли видеть, когда ваши выбросы находятся, чтобы увидеть, вообще говоря, где это значение попадает в те периоды времени, когда мы собирали данные. И затем, в дополнение к этому, вы также заметите, что когда мы переходим к самому фактическому экземпляру, у нас есть возможность настроить наши базовые показатели. И базовые показатели - это действительно важная часть способности автоматизировать вещи, а также получать уведомления о них. И проблема, как сказали бы большинство администраторов баз данных, заключается в том, что ваша среда не всегда работает одинаково в течение дня, по сравнению с вечером и так далее, как мы упоминали ранее в примере с периодами обслуживания, когда мы иметь высокий уровень процессора или что-то, что может происходить.
Итак, в данном случае, с этими фактическими базовыми показателями, у нас может быть несколько базовых показателей, поэтому у меня может быть базовый уровень, например, это в часы моего обслуживания. Но я мог бы так же легко создать основу для своих рабочих часов. И смысл этого заключается в том, что когда мы входим в экземпляр SQL, и у нас фактически есть эти многочисленные базовые показатели, тогда мы сможем предвидеть и иметь возможность выполнять некоторый тип автоматизации, некоторый тип исправления или просто оповещение вообще, по-разному характерны для этих окон времени Итак, одна из вещей, которые вы увидите здесь, это то, что эти базовые показатели, которые мы генерируем, используют исторические данные для обеспечения этого анализа, но, что более важно, я могу изменить эти пороги статически, но я также могу автоматизировать их также динамически. Итак, когда появляется окно технического обслуживания, или я должен сказать, что окно базового уровня обслуживания, эти пороги будут автоматически переключаться в зависимости от нагрузок, с которыми я сталкиваюсь в это время, по сравнению с, возможно, в середине дня, когда мои нагрузки не так много, когда рабочие нагрузки не столь значительны.
Итак, это еще кое-что, что нужно иметь в виду, с точки зрения базовой линии. Очевидно, что это будет очень полезно для вас, с точки зрения понимания того, что является нормальным, и способности также понимать, вовлекаться, когда у вас также будут исчерпаны ресурсы. Теперь, другая вещь, которую мы имеем в инструменте, которая поможет вам принимать решения, в дополнение к базовым линиям и возможности устанавливать оповещения вокруг этих базовых уровней и порогов, которые вы динамически создаете, как я уже говорил ранее, просто возможность составлять целое множество отчетов, которые помогают мне отвечать на вопросы о том, что происходит.
Так, например, если бы у меня было 150 экземпляров, которыми я управляю - в моем случае нет, поэтому мы должны сыграть здесь в притворную игру - но если у меня были все мои производственные экземпляры, и мне нужно было понять, где находится Другими словами, в той области, на которую мне нужно обратить внимание, если у меня будет ограниченное количество времени на выполнение какого-либо администрирования для повышения производительности, я хочу сосредоточиться на ключевых областях. И поэтому, с учетом сказанного, я мог бы сказать: «На основе этой среды ранжируйте мои экземпляры друг с другом и дайте мне это ранжирование по каналу конкуренции». Так что, будь то использование диска, использование памяти, ожидание, будь то время отклика, я могу сопоставить - или я должен сказать ранжирование - эти случаи друг против друга. Очевидно, что экземпляр, который находится вверху каждого списка, если это один и тот же экземпляр, вероятно, на этом я действительно хочу сосредоточиться, потому что он, очевидно, еще раз находится наверху списка.
Итак, у вас есть много отчетов в инструменте, которые помогут вам с точки зрения ранжирования среды на уровне экземпляра; Вы можете сделать это также на уровне базы данных, где я могу сравнить свои базы данных друг с другом. В частности, для порогов и областей, которые я могу установить, я даже могу установить здесь шаблоны, если хочу, чтобы сосредоточиться только на конкретных базах данных, но дело в том, что я могу сравнивать свои базы данных таким же образом. Кроме того, что касается других видов сравнительного анализа и большого в этом инструменте, это базовый анализ, который мы имеем. Поэтому, если вы прокрутите вниз до представления службы здесь, вы увидите, что есть базовый статистический отчет. Теперь этот отчет, очевидно, поможет нам понять не только то, что представляют собой значения метрик, но и для конкретного случая, который я мог бы использовать, и для любой из этих метрик можно было бы реально взглянуть на базовые показатели для этих метрик.
Так что, как бы это ни было, в процентах или как я мог бы выйти и сказать: «Давайте посмотрим на базовый уровень для этого разбитого за последние 30 дней», и в этом случае он покажет мне фактические значения по сравнению с базовым и Я мог бы принять некоторые решения, используя эту информацию, очевидно, так что это одна из тех ситуаций, когда она будет зависеть от того, какой это вопрос, который вы задаете в данный момент. Но это, очевидно, поможет вам во многих из этих вопросов. Хотелось бы сказать, что у нас был один отчет, который делает все это, и это вроде простой отчет, где вы нажимаете и нажимаете кнопку, и он просто отвечает на каждый вопрос «что если», на который вы когда-либо могли ответить. Но реальность такова, что в этих раскрывающихся списках у вас будет множество атрибутов и множество вариантов, из которых вы сможете выбирать, чтобы иметь возможность формулировать те вопросы типа «что, если», которые вы ищете,
Поэтому многие из этих отчетов направлены на то, чтобы отвечать на вопросы такого типа. И поэтому очень важно также, чтобы эти отчеты и, кроме того, все то, что мы уже показали вам в инструменте, как я уже упоминал ранее, обладает гибкостью, позволяющей включать новые метрики, управлять ими и даже создавать счетчики, или SQL-запросы, которые включены в ваши интервалы опроса, чтобы помочь мне ответить на эти вопросы, которые, возможно, из коробки, которую мы не ожидали отслеживать, вы можете добавить эти вещи. И тогда вы сможете делать все то же самое, что я только что показал вам: базовый уровень, запускать отчеты и создавать отчеты из этой метрики, а также иметь возможность отвечать и выполнять множество различных типов вещей, которые я вам показываю. Вот.
Теперь, в дополнение к этому - и одна из вещей, с которыми мы, очевидно, столкнулись в последнее время, - это то, что все переключались или переключались на виртуальные машины. И теперь у нас много людей, которые направляются в облако. И есть много вопросов, которые возникают вокруг этих типов вещей. Имеет ли смысл переходить в облако? Собираюсь ли я сэкономить, перейдя в облако? Если бы я положил эти вещи на виртуальную машину, на машину с общими ресурсами, сколько денег я смог бы сэкономить? Эти типы вопросов, очевидно, также будут возникать. Итак, многое из этого следует иметь в виду, с помощью Diagnostic Manager мы можем добавлять и извлекать из виртуализированных сред как VMware, так и Hyper-V. Мы также можем добавлять экземпляры, которые находятся в облаке, поэтому в ваших средах, таких как, например, Azure DB, или даже RDS, мы также можем получать метрики из этих сред.
Таким образом, существует большая гибкость и возможность ответить на эти вопросы, поскольку они связаны с другими типами сред, в которые мы направляем людей. И есть еще много вопросов вокруг этого материала, и, поскольку мы видим, что люди консолидируют эти среды, они также должны будут иметь возможность ответить на эти вопросы. Итак, я бы сказал, что это довольно хороший обзор Diagnostic Manager, поскольку он относится к этой теме. Я знаю, что возникла тема бизнес-аналитики, и у нас также есть инструмент для бизнес-аналитики, о котором мы сегодня не говорили, но он также даст вам представление о том, как ответить на эти типы вопросов, поскольку это относится к вашей кубики и все эти разные типы вещей, а также. Но, надеюсь, это был хороший обзор, по крайней мере, с точки зрения того, как этот продукт может помочь в разработке хорошего плана.
Эрик Кавана: Хорошо, хорошие вещи. Да, я брошу это Рику, если он все еще там. Рик, есть вопросы от тебя?
Рик Шерман: Да, во-первых, это здорово, мне это нравится. Мне особенно нравится расширение до виртуальных машин и облаков. Я вижу, что многие разработчики приложений думают, что если это в облаке, им не нужно настраивать его. Так-
Bullett Manale: Да, мы все еще должны заплатить за это, верно? Вам все еще нужно платить за то, что люди вкладывают в облако, поэтому, если он работает плохо или вызывает много циклов ЦП, вам нужно больше платить, так что нет, вы все еще нужно измерить этот материал, абсолютно.
Рик Шерман: Да, я видел много плохих дизайнов в облаке. Я действительно хотел спросить, будет ли этот продукт также использоваться - я знаю, что вы упомянули продукт BI, и у вас есть тонны других продуктов, которые взаимодействуют друг с другом - но вы бы начали смотреть на производительность SQL, отдельные запросы в этом инструменте? Или это будут другие инструменты, которые будут использоваться для этого?
Буллет Манале: Нет, это было бы абсолютно. Это одна из вещей, которую я не охватил и я имел в виду, это часть запросов. У нас есть много разных способов определить производительность запросов, независимо от того, связано ли это с определенными ожиданиями, которые мы видим в этом представлении, или же это связано с потреблением ресурсов запросами в целом, мы можем проанализировать запрос целым рядом способов. производительность. Будь то продолжительность, ЦП, ввод / вывод, и еще раз, мы также можем посмотреть на сами рабочие нагрузки, чтобы получить некоторое представление. Мы можем предоставить рекомендации в разделе анализа, а также у нас есть веб-версия, которая предоставляет информацию о самих запросах. Так что я могу получить рекомендации по отсутствующим индексам и возможность просмотра плана выполнения и всего такого; это также возможность. Так что, безусловно, мы можем диагностировать запросы по семи путям до воскресенья (смеется) и быть в состоянии обеспечить это понимание с точки зрения количества выполнений, будь то потребление ресурсов, ожидания, продолжительность, и все такое хорошее.
Рик Шерман: ОК, отлично. И какова нагрузка на сами экземпляры со всем этим мониторингом?
Bullett Manale: Это хороший вопрос. Проблема с ответом на этот вопрос заключается в том, зависит ли это, как и все остальное. Многое из того, что может предложить наш инструмент, обеспечивает гибкость, и часть этой гибкости заключается в том, что вы можете сказать ему, что собирать, а что не собирать. Так, например, с самими запросами мне не нужно собирать информацию об ожидании, или я могу. Я могу собирать информацию, связанную с запросами, которые превышают продолжительность выполнения. Как пример этого, если бы я зашел в монитор запросов конфигурации и сказал: «Давайте изменим это значение на ноль», то реальность такова, что в основном инструмент заставляет собирать каждый выполняемый запрос, а это на самом деле не дух того, что там есть, но, вообще говоря, если бы я хотел предоставить полную выборку данных для всех запросов, я мог бы это сделать.
Таким образом, это очень сильно зависит от того, какие у вас настройки, вообще говоря, из коробки. Это примерно от 1 до 3% накладных расходов, но есть и другие условия, которые будут применяться. Это также зависит от того, сколько запросов к порту выполняется в вашей среде, верно? Это также зависит от метода сбора этих запросов и версии SQL. Так, например, в SQL Server 2005 мы не сможем извлекать из расширенных событий, тогда как для этого мы будем извлекать из трассировки. Таким образом, было бы немного по-другому с точки зрения того, как мы собираемся собирать эти данные, но это говорит о том, что, как я уже сказал, мы были примерно с 2004 года с этим продуктом. Это было давно, у нас тысячи клиентов, поэтому последнее, что мы хотим сделать, - это иметь инструмент мониторинга производительности, который вызывает проблемы с производительностью (смеется). И поэтому мы стараемся держаться подальше от этого, насколько это возможно, но, вообще говоря, примерно 1-3 процента - это хорошее эмпирическое правило.
Рик Шерман: Хорошо, и это довольно низко, так что это потрясающе.
Эрик Кавана: Хорошо. Робин, есть вопросы от тебя?
Робин Блур: Извините, я был отключен. У вас есть возможность работы с несколькими базами данных, и мне интересно, как вы можете просматривать несколько баз данных, и, следовательно, вы можете знать, что большая база ресурсов может быть разделена между различными виртуальными машинами и так далее, и так далее. Мне интересно, как люди на самом деле используют это. Мне интересно, что клиенты делают с этим. Потому что это выглядит для меня, ну, конечно, когда я возился с базами данных, то, чего у меня никогда не было под рукой. И я бы только когда-либо рассматривал один случай любым значимым образом в любой данный момент времени. Итак, как люди используют это?
Bullett Manale: Вообще говоря, вы говорите о самом инструменте? Как они это используют? Я имею в виду, в общем, речь идет о возможности иметь центральную точку присутствия окружающей среды. Имея душевное спокойствие и зная, что если они смотрят на экран и видят зеленый, они знают, что все хорошо. Это происходит, когда возникают проблемы, и, очевидно, в большинстве случаев с точки зрения администратора баз данных, часто эти проблемы возникают, когда они находятся перед консолью, поэтому они могут быть уведомлены, как только возникнет проблема. Но в дополнение к этому, способность понимать, когда проблема действительно возникает, быть способной добраться до сути информации, которая предоставляет им некоторый контекст с точки зрения того, почему это происходит. И это, я думаю, самая важная часть: проявлять инициативу, а не реагировать.
Большинство администраторов баз данных, с которыми я общаюсь - и я не знаю, это хороший процент из них - к сожалению, все еще находятся в реактивной среде; они ждут, пока потребитель приблизится к ним, чтобы сказать им, что есть проблема. Итак, мы видим, что многие люди пытаются оторваться от этого, и я думаю, что большая часть причины, по которой людям нравится этот инструмент, заключается в том, что он помогает им быть активными, но также дает им понимание того, что происходит. В чем проблема, но во многих случаях, что мы находим, по крайней мере, - и, возможно, это только администраторы баз данных говорят нам об этом - но администраторы баз данных считают, что это всегда их проблема, даже если разработчик приложения написал приложение которые не написали это должным образом, именно они возьмут на себя вину, потому что они переносят это приложение на свои системы или серверы, а затем, когда производительность плохая, все указывают на то, что администратор базы данных говорит: «Эй, это твоя вина»
Таким образом, этот инструмент много раз будет использоваться, чтобы помочь администратору БД сказать: «Эй, это проблема, а не я». (Смеется.) Нам нужно улучшить это, будь то изменение запросов или что-то еще. В некоторых случаях это падает в их ведении с точки зрения их ответственности, но, по крайней мере, наличие инструмента, который поможет им понять это и знать это, и делать это своевременно, очевидно, является идеальным подходом.
Робин Блур: Да, большинство сайтов, с которыми я знаком, но прошло уже много времени с тех пор, как я был там, просматривая различные сайты с несколькими базами данных, но в основном я находил, что есть Администраторы баз данных, которые сосредоточены на нескольких базах данных. И это будут базы данных, которые, если они когда-нибудь выйдут из строя, станут большой проблемой для бизнеса, и так далее, и тому подобное. А другие, они просто будут время от времени собирать статистику, чтобы увидеть, что у них не осталось свободного места, и они никогда не будут на них смотреть. И пока вы делали демонстрацию, я смотрел на это, и я хорошо думал, так или иначе, вы расширяете, просто предоставляя что-то подобное для баз данных, которые часто никого не заботили, потому что у них рост данных, они имеют рост приложений в разы. Вы расширяете охват DBA довольно драматично. Так вот в чем заключается вопрос, действительно ли с таким набором инструментов вы в конечном итоге сможете в значительной степени предоставлять услугу DBA для каждой базы данных, находящейся в корпоративной сети?
Bullett Manale: Конечно, я имею в виду, проблема в том, что, как вы довольно красноречиво сказали, как будто есть какие-то базы данных, о которых заботятся администраторы баз данных, а затем есть некоторые, которые им не безразличны. И способ, которым этот конкретный продукт, способ, которым он лицензируется, является для каждого отдельного случая. Итак, есть, я думаю, вы бы сказали, порог, когда люди решают: «Эй, это не достаточно критический случай, чтобы я хотел управлять им с помощью этого инструмента». Тем не менее, есть и другие инструменты, которые мы делаем Я полагаю, это больше, чем угождает этим менее важным экземплярам SQL. Один из них похож на Менеджера инвентаризации, где мы проводим легкие проверки работоспособности экземпляров, но в дополнение к этому мы делаем обнаружение, поэтому мы идентифицируем новые экземпляры, которые были переведены в сеть, а затем, с этого момента, как администратор базы данных, я могу сказать: «Хорошо, вот новый экземпляр SQL, теперь это Express? Это бесплатная версия или версия для предприятий? ». Вероятно, это вопрос, который я хочу задать себе, но, во-вторых, насколько важен этот экземпляр для меня? Если это не так важно, я мог бы предложить этот инструмент и сделать его, общий, то, что я бы назвал общими проверками работоспособности, в том смысле, что это элементарные типы вещей, которые мне небезразличны как администратор баз данных: заполнен ли диск? ? Сервер отвечает на проблемы? Главное, правда?
Принимая во внимание, что с помощью Diagnostic Manager, инструмента, который я только что показал вам, он опустится до уровня запроса, перейдет к рекомендации по индексам, рассмотрит план выполнения и все эти хорошие вещи, тогда как в основном это сфокусировано о том, кому что принадлежит, чем я владею и кто за это отвечает? Какие пакеты обновления и исправления у меня есть? И работают ли мои серверы с основными компонентами того, что я считаю здоровым экземпляром SQL? Итак, чтобы ответить на ваш вопрос, есть небольшая смесь. Когда у нас есть люди, которые смотрят на этот инструмент, они обычно смотрят на более критический набор примеров. Тем не менее, у нас есть некоторые люди, которые покупают каждый экземпляр и управляют им, так что это просто зависит. Но я говорю вам, что в целом определенно существует порог для тех людей, которые считают, что их среда достаточно важна, чтобы иметь такой инструмент для управления этими экземплярами.
Робин Блур: Хорошо, еще один вопрос, прежде чем я передам его Эрику. Создается впечатление, что, наблюдая за отраслью, создается впечатление, что у баз данных еще есть жизнь, но все данные перетекают во все эти озера данных и так далее, и так далее. Это обман, правда, и обман никогда не отражает реальность, поэтому мне интересно, какую реальность вы там воспринимаете? Являются ли важные базы данных в организации, они испытывают традиционный рост данных, который я привык считать 10% в год? Или они растут больше, чем это? Большие данные делают эти базы всплывающими? Какую картинку вы видите?
Bullett Manale: я думаю, что во многих случаях мы видим, как некоторые данные перемещаются в другие сегменты, где это имеет больше смысла, когда становятся доступными другие технологии. В последнее время некоторые из больших данных. Но я бы сказал, что эти базы данных трудно обобщать во многих случаях, потому что все немного разные. Вообще говоря, я вижу некоторое расхождение. Я вижу, как я уже сказал, люди переходят на эластичные модели во многих случаях, потому что они хотят наращивать ресурсы, а не так сильно в других областях. Некоторые люди переходят на большие данные. Но, скажем так, сложно понять, как это воспринимается, потому что, вообще говоря, люди, с которыми я общаюсь, имеют традиционные базы данных и используют это в среде SQL Server.
Тем не менее, я бы сказал, что с точки зрения самого SQL, я определенно все еще думаю, что он набирает долю рынка. И я думаю, что есть много людей, которые все еще стремятся к SQL из других мест, таких как Oracle, потому что это более доступно и, очевидно, очевидно, поскольку версии SQL становятся более продвинутыми - и вы видите это с более свежими вещами, которые продолжаем использовать SQL с точки зрения шифрования и всех других возможностей, которые делают его средой или платформой базы данных - это, очевидно, очень важно для критически важных задач, я полагаю. Так что, думаю, мы тоже это видим. Где вы видите сдвиг, это все еще происходит. Я имею в виду, что это происходило 10 лет назад, и все же, я думаю, это происходит с точки зрения SQL Server, где среда растет и доля рынка растет.
Робин Блур: Хорошо, Эрик, я полагаю, у аудитории есть вопрос или два?
Эрик Кавана: Да, позвольте мне дать вам один быстрый. На самом деле это довольно хороший вопрос. Один из участников спрашивает, будет ли этот инструмент сообщать мне, если таблице может понадобиться индекс для ускорения запроса? Если да, можете ли вы показать пример?
Bullett Manale: Да, так что я не знаю, есть ли у меня один для конкретного добавления индекса, но вы можете увидеть здесь, у нас есть рекомендации фрагментации здесь. Я также просто верю, что мы только что это сделали, и это было частью Diagnostic Manager, предлагающего веб-версию, в которой говорится, что у меня отсутствует индекс. И мы можем просмотреть эти рекомендации, и они покажут нам потенциальную выгоду от этого путем индексации этой информации. Еще одна вещь, которую я должен упомянуть, это то, что когда мы выполняем рекомендации, для многих из них для них будет создан сценарий. Это плохой пример, но вы могли бы увидеть, да, ситуации, когда индекс - или дублирующий индекс, или добавление индекса - улучшит производительность, и, как я уже говорил ранее, мы делаем много что с помощью анализа гипотетического индекса. Таким образом, это действительно помогает с точки зрения понимания рабочей нагрузки, чтобы иметь возможность применить это к рекомендации.
Эрик Кавана: Это отличная штука, и это даст мне хороший переход к последним комментариям здесь. Робин, я и Рик тоже слышали уже много лет, что говорят о самонастраивающихся базах данных. Это самонастраивающаяся база данных! Все, что я могу вам сказать: не верьте им.
Bullett Manale: Не верьте обману.
Эрик Кавана: Могут быть небольшие мелочи, которые выполняются динамически, но даже если вы захотите проверить это и убедиться, что он не делает то, чего вы не хотите. Итак, в течение некоторого времени нам понадобятся такие инструменты, чтобы понять, что происходит на уровне базы данных, и, как сказал Робин, озёра данных - это увлекательная концепция, но, вероятно, вероятность того, что они вступят во владение, равна скоро будет Лох-Несское чудовище. Итак, я бы еще раз сказал, что в реальном мире много технологий баз данных, нам нужны люди, администраторы баз данных, чтобы посмотреть на это и синтезировать его. Вы можете сказать, что вам нужно знать, что вы делаете, чтобы этот материал работал. Но вам нужны инструменты, чтобы дать вам информацию, чтобы знать, что вы делаете. Итак, суть в том, что администраторы баз данных будут работать очень хорошо.
И большое спасибо Bullett Manale и нашим друзьям в IDERA. И конечно же Рик Шерман и Робин Блур. Мы архивируем все эти веб-трансляции, поэтому пройдите онлайн на сайте insideanalysis.com или на наш партнерский сайт www.techopedia.com для получения дополнительной информации обо всем этом.
И с этим мы прощаемся с вами, ребята. Еще раз спасибо, мы поговорим с вами в следующий раз. Береги себя. Пока-пока.