Видео: Introduction to Amazon Web Services by Leo Zhadanovsky 2024
Так что же это за штука со смешным именем - Hadoop? В основе своей Hadoop - это основа для хранения данных о больших кластерах < товар аппаратное обеспечение - бытовое компьютерное оборудование, доступное и легко доступное, - и запуск приложений против этих данных. cluster - это группа взаимосвязанных компьютеров (называемых узлами ). которые могут работать вместе по одной и той же проблеме.
Что касается этого имени, Hadoop, не смотря на какое-либо важное значение, просто имя, которое дал сын Дуга Реттинг своему набитому слону (Дуг Реттинг, конечно же, со-создатель Хадоопа). Имя уникально и легко запоминается - характеристики, которые сделали его отличным выбором.
Приложение, работающее на Hadoop, получает свою работу, разделенную между узлами (машинами) в кластере, а HDFS хранит данные, которые будут обработаны. Hadoop-кластер может охватывать тысячи компьютеров, где HDFS хранит данные, а задания MapReduce выполняют свою обработку вблизи данных, что снижает затраты на ввод-вывод. MapReduce чрезвычайно гибкий и позволяет разрабатывать самые разнообразные приложения.
, тип кластера, который используется в основном для вычислительных целей. В вычислительном кластере многие компьютеры ( вычислительные узлы ) могут совместно использовать вычислительные рабочие нагрузки и использовать очень большую совокупную пропускную способность в кластере. Кластеры Hadoop обычно состоят из нескольких
главных узлов , которые управляют системами хранения и обработки в Hadoop и многими подчиненными узлами , , которые хранят все данные кластера, а также где данные обрабатываются.