Оглавление:
Когда вы думаете, что у вас есть отличная идея, но вам нужно проверить ее, вы хотите проверить ее как можно быстрее и с минимальными затратами. Вы не хотите вступать в длительный цикл разработки и тестирования и тратить много времени и денег. Apache Spark облегчает быструю разработку приложений, главным образом потому, что он позволяет вам быстро протестировать свои идеи с помощью оболочки и API.
Что такое Apache Spark?
Технически Apache Spark - это механизм обработки данных, который может извлекать огромные куски данных и обрабатывать их в одно мгновение. Двумя его основными характеристиками являются скорость обработки данных и производительность в памяти. Эта инфраструктура кластерных вычислений является инструментом с открытым исходным кодом, который помогает начинающим разработчикам создавать свои приложения в кратчайшие сроки.
Эта расширенная среда обработки данных разработана AMP Lab и была опубликована в 2010 году как инструмент с открытым исходным кодом как неотъемлемая часть проекта Apache. Весь проект Spark написан на языке Scala и может работать на виртуальной машине на основе Java (JVM).