Q:
Каковы четыре основания стать хорошим ученым данных?
A:Как отмечают многие эксперты, для того, чтобы стать великим ученым в области данных, требуется сочетание навыков и опыта, которые приобретаются благодаря специальному обучению и анализу сложной области. Специалисты по обработке данных, как администраторы и хранители ценных активов данных, сегодня очень востребованы. Давайте посмотрим, что включают в себя некоторые из этих основополагающих навыков.
Первым из четырех фундаментальных компонентов работы ученого данных является математика и статистика. Хорошие ученые, работающие с данными, должны научиться разбираться в различных математических понятиях, относящихся к контролируемому и неконтролируемому машинному обучению, включая такие типы алгоритмов, как деревья решений, случайный лес, логистическая регрессия, кластеризация и использование размерности в машинном обучении (ML). В целом, они должны хорошо разбираться в работе с математическими уравнениями и статистикой, используя ресурсы статистического анализа.
Вторым важным фундаментальным компонентом работы по науке о данных является программирование и управление базами данных. Люди должны быть сильными в языках сценариев, таких как Python, и в статистических языках, таких как R, а также в своем опыте и навыках работы с базой данных, семантикой SQL и методами работы. Знание программных компонентов, таких как Hadoop, MapReduce, Hive и Pig, также привлекательно для работодателей.
Третий фундаментальный компонент становления хорошим исследователем данных - это теоретический и философский компонент понимания науки о данных и машинного обучения. Эти люди должны самостоятельно решать возникающие проблемы с любопытными умами - в конце концов, они сочетают необработанный количественный анализ с творческим пониманием процессов машинного обучения и науки о данных. Вместо того, чтобы быть просто техническими специалистами, они должны глубоко понимать, что значит создавать проекты машинного обучения и работать над инициативами в области наук о данных с точки зрения конечных целей и конечных результатов.
Четвертый основной принцип обучения быть хорошими учеными в области данных включает в себя работу с людьми и способность использовать данные способами, которые имеют смысл для других людей.
Хорошие ученые в области данных могут быть рассказчиками - они могут переводить количественные данные в рассказы и идеи. Как таковые, они должны обладать хорошими коммуникативными навыками, чтобы иметь возможность представить свою работу за столом и эффективно распространить ее среди множества заинтересованных сторон или определенной аудитории. Это некоторые из основных типов навыков, которые формируют хорошего ученого, готового участвовать в современной быстро развивающейся и быстро развивающейся ИТ-индустрии.
