Дом Личные финансы Импорт данных с помощью Sqoop-dummies

Импорт данных с помощью Sqoop-dummies

Видео: Sqoop Import and Export data from RDMBS and HDFS 2024

Видео: Sqoop Import and Export data from RDMBS and HDFS 2024
Anonim

Готовы ли погрузиться в импорт данных с помощью Sqoop? Начнем с рассмотрения рисунка, который иллюстрирует шаги в типичной операции импорта Sqoop из СУБД или системы хранилища данных. Здесь нет ничего сложного - просто типичная таблица данных о продуктах (типичная) вымышленная компания, импортируемая в типичный кластер Apache Hadoop из типичной системы управления данными (DMS).

На шаге 1 Sqoop использует соответствующий соединитель для извлечения метаданных таблицы Products из целевой DMS. (Метаданные используются для сопоставления типов данных из таблицы Products с типами данных на языке Java.)

Этап 2 затем использует эти метаданные для генерации и компиляции класса Java, который будет использоваться одной или несколькими задачами карты для импортируйте фактические строки из таблицы Products. Sqoop сохраняет созданный Java-класс временному пространству или указанному вами каталогу, чтобы вы могли использовать его для последующей обработки ваших записей данных.

Созданный Sqoop код Java, который сохраняется для вас, похож на подарок, который продолжает давать! С помощью этого кода Sqoop импортирует записи из DMS и сохраняет их в HDFS, используя один из трех форматов, которые вы можете выбрать: бинарные данные Avro, файлы двоичной последовательности или текстовые файлы с разделителями. Впоследствии этот код доступен для последующей обработки данных.

Файлы последовательности являются естественным выбором, если вы импортируете двоичные типы данных, и вам понадобится сгенерированный класс Java для сериализации и десериализации данных позже - возможно, для MapReduce обработки или экспорта. Данные Avro, основанные на собственной структуре сериализации Apache, полезны, если вам нужно взаимодействовать с другими приложениями после импорта в HDFS.

Если вы решите сохранить ваши импортированные данные в текстовом формате с разделителями, вы можете найти сгенерированный код Java, ценный позже, при анализе и преобразовании формата данных в новые данные. Вы увидите, что сгенерированный код также помогает объединять наборы данных после операций импорта Sqoop, а сгенерированный код Java может помочь избежать двусмысленности при обработке текстовых данных с разделителями.

Наконец, на этапе 3 Sqoop делит записи данных в таблице «Продукты» на множество задач карты (с числом опций, заданных пользователем) и импортирует данные таблицы в HDFS, Hive или HBase.

Импорт данных с помощью Sqoop-dummies

Выбор редактора

Будьте добры, когда практикуете вдумчивость - манекены

Будьте добры, когда практикуете вдумчивость - манекены

Недавно, в телевизионной программе Би-би-си были предложены три ключа к благополучию: помните, будьте благодарны и будьте добрыми. Какое замечательное предложение! Примите более глубокий взгляд на эту форму благополучия: доброту. Когда вы выполняете доброту для других, вы получаете много преимуществ взамен: вы чувствуете себя прекрасно. Просто подумайте о ...

Помните о своей позе тела - манекены

Помните о своей позе тела - манекены

, Возможно, вы заметили, как ваши эмоции влияют на ваше тело. Если вы чувствуете себя синим, вы, скорее всего, будете смотреть вниз и медленно ходить со сгорбленными плечами. Но если вы чувствуете себя уверенно, вы, вероятно, стоите выше своих плеч, и вы ходите немного быстрее и целенаправленно. Интересно, что новые исследования показывают ...

Избегая дорожных блоков для уменьшения стресса - манекены

Избегая дорожных блоков для уменьшения стресса - манекены

, Если вы вспомните свою последнюю попытку потерять несколько фунтов или избавиться от всех беспорядок в вашем доме, вы можете признать, что благие намерения не всегда гарантируют успех. Обычно вы сталкиваетесь с одним или двумя блокпостами. Однако, осознавая потенциальные препятствия на вашем пути и выясняя способы их избежать ...

Выбор редактора

Двухэтапная проверка Evernote - макеты

Двухэтапная проверка Evernote - макеты

Evernote предлагает пользователям двухэтапную аутентификацию (известную в отрасли как двухфакторную аутентификация), которая предназначена для защиты вашей учетной записи, даже если кто-то узнает ваш пароль. Он делает это, требуя проверочный код, когда вам предлагается указать свое имя пользователя и пароль. Этот запрос обычно возникает только при входе в Evernote Web или ...

Evernote Синхронизирует заметки автоматически - макеты

Evernote Синхронизирует заметки автоматически - макеты

Основным преимуществом Evernote является то, что он позволяет вам получить доступ к самым последним версиям всех ваши заметки, независимо от того, какое устройство вы используете - даже когда вы вошли в библиотечный компьютер, чтобы дважды проверить список продуктов, потому что аккумулятор вашего телефона уже мертв. Возможность Evernote синхронизировать заметки на всех устройствах ...

Как получить доступ к общедоступной записной книжке Evernote - манекенам

Как получить доступ к общедоступной записной книжке Evernote - манекенам

На веб-браузерах, ноутбуке, который был открыт совместно с Public URL-адрес ссылки появляется на левой боковой панели под отдельным заголовком «Присоединившиеся ноутбуки». На настольной версии слева от любого совместно используемого ноутбука появляется значок, который выглядит как три человека. Для доступа к ноутбуку, совместно используемому общей ссылкой ...

Выбор редактора

Найти шрифты для веб-дизайна онлайн - манекены

Найти шрифты для веб-дизайна онлайн - манекены

, Хотя вы можете загрузить любой шрифт, который у вас есть сервер и ссылку на него, онлайновый репозиторий шрифтов дает много преимуществ, шрифт хранится на серверах хранилища и предоставляет CSS для включения шрифта на ваш сайт. Интернет-репозитории шрифтов также заботятся о любых проблемах с лицензированием. Шрифты, многое ...

Краевые петли и циклы контуров в Blender - манекены

Краевые петли и циклы контуров в Blender - манекены

, Вообще говоря, краевой цикл в Blender является ряд ребер, которые соединяются, образуя путь, где первый и последний ребра соединяются друг с другом - ну, в любом случае, это идеальный случай. Такой замкнутый контур края представляет собой «хороший» контур края. Конечно, тогда вы, вероятно, захотите узнать, что ...

Установление отношений родитель-ребенок между объектами в Blender - манекены

Установление отношений родитель-ребенок между объектами в Blender - манекены

Создание отношений родитель-потомок между объектами или родительский учет в Blenderese, организует объекты иерархически. Объект может иметь любое количество детей, но ни один объект не может иметь больше одного родителя: Чтобы сделать объект родителем, сначала выберите объекты, которые вы хотите быть дочерними. Они не должны быть одного типа. ...