Q:
Что может быть лучше, платформа или собственный алгоритм машинного обучения в AWS?
A:В наши дни многие компании интегрируют решения для машинного обучения в свои аналитические инструменты, чтобы улучшить управление брендом, улучшить качество обслуживания клиентов и повысить эффективность работы. Модели машинного обучения являются основным компонентом решений для машинного обучения. Модели обучаются с использованием математических алгоритмов и больших наборов данных, чтобы делать надежные прогнозы. Двумя распространенными примерами прогнозов являются (1) определение того, является ли набор финансовых транзакций мошенничеством, или (2) оценка настроений потребителей в отношении продукта на основе информации, полученной из социальных сетей.
Amazon SageMaker - это полностью управляемый сервис, который позволяет разработчикам и ученым создавать, обучать и развертывать модели машинного обучения. В SageMaker вы можете использовать готовые алгоритмы или пойти по пути собственного решения для более индивидуального решения. Оба варианта действительны и служат в равной степени основой для успешного решения для машинного обучения.
(Примечание редактора: вы можете увидеть другие альтернативы SageMaker здесь.)
Встроенные алгоритмы SageMaker включают популярные, высоко оптимизированные примеры для классификации изображений, обработки естественного языка и т. Д. Полный список можно найти здесь .
- Преимущества «из коробки»: эти алгоритмы были предварительно оптимизированы (и постоянно совершенствуются). Вы можете быть быстро запущены и развернуты. Кроме того, доступна автоматическая настройка гиперпараметров AWS.
- Исходные соображения . Упомянутые выше постоянные улучшения могут не давать таких результатов, как если бы вы имели полный контроль над реализацией своих алгоритмов.
Если эти алгоритмы не подходят для вашего проекта, у вас есть три других варианта: (1) библиотека Apache Spark от Amazon, (2) пользовательский код Python (который использует TensorFLow или Apache MXNet) или (3) «принесите свой собственный», где вы по существу не ограничены, но для обучения и обслуживания вашей модели потребуется создать образ Docker (вы можете сделать это, следуя инструкциям здесь ).
Подход «принеси свой собственный» предлагает вам полную свободу. Это может оказаться привлекательным для исследователей данных, которые уже создали библиотеку нестандартного и / или проприетарного алгоритмического кода, который может отсутствовать в текущем наборе «из коробки».
- Привнесите свои преимущества: обеспечивает полный контроль над всем конвейером данных, а также использование проприетарного IP.
- Принесите свои собственные соображения: Докеризация необходима для обучения и обслуживания полученной модели. Ответственность за внедрение алгоритмических улучшений лежит на вас.
Независимо от вашего выбора алгоритма, SageMaker на AWS - это подход, который стоит рассмотреть, учитывая, насколько большое внимание было уделено простоте использования с точки зрения науки о данных. Если вы когда-либо пытались перенести проект машинного обучения из локальной среды в хостовую, вы будете приятно удивлены тем, насколько эффективно SageMaker делает это. И если вы начинаете с нуля, вы уже на несколько шагов ближе к своей цели, учитывая, сколько уже у вас под рукой.