Дом Личные финансы Роль традиционного ETL в больших данных - манекены

Роль традиционного ETL в больших данных - манекены

Видео: What is Hadoop SQL Comparison с русскими субтитрами 2024

Видео: What is Hadoop SQL Comparison с русскими субтитрами 2024
Anonim

Инструменты ETL объединяют три важные функции (извлечение, преобразование, загрузка), необходимые для получения данных из одной большой среды данных и поместить его в другую среду данных. Традиционно ETL использовался с пакетной обработкой в ​​средах хранилища данных. Хранилища данных предоставляют бизнес-пользователям возможность консолидировать информацию для анализа и представления данных, относящихся к их бизнес-фокусу. Инструменты ETL используются для преобразования данных в формат, требуемый хранилищами данных.

Преобразование фактически выполняется в промежуточном местоположении до того, как данные будут загружены в хранилище данных. Многие поставщики программного обеспечения, включая IBM, Informatica, Pervasive, Talend и Pentaho, предоставляют программные инструменты ETL.

ETL предоставляет базовую инфраструктуру для интеграции, выполняя три важные функции:

  • Извлечение: Чтение данных из исходной базы данных.

  • Преобразование: Преобразование формата извлеченных данных, чтобы он соответствовал требованиям целевой базы данных. Трансформация осуществляется с использованием правил или слияния данных с другими данными.

  • Загрузка: Запись данных в целевую базу данных.

Тем не менее, ETL развивается, чтобы поддерживать интеграцию гораздо больше, чем традиционные хранилища данных. ETL может поддерживать интеграцию между транзакционными системами, операционными хранилищами данных, платформами BI, концентраторами MDM, облаками и платформами Hadoop. Поставщики программного обеспечения ETL расширяют свои решения для обеспечения большой добычи данных, трансформации и загрузки между Hadoop и традиционными платформами управления данными.

ETL и программные инструменты для других процессов интеграции данных, таких как очистка данных, профилирование и аудит всей работы с различными аспектами данных, чтобы гарантировать, что данные будут считаться заслуживающими доверия. Инструменты ETL интегрируются с инструментами качества данных, а многие из них включают инструменты для очистки данных, сопоставления данных и идентификации линий данных. С помощью ETL вы извлекаете только данные, необходимые для интеграции.

Инструменты ETL необходимы для загрузки и преобразования структурированных и неструктурированных данных в Hadoop. Расширенные инструменты ETL могут читать и записывать несколько файлов параллельно с Hadoop и упрощать процесс объединения данных в общий процесс преобразования. Некоторые решения включают библиотеки готовых ETL-преобразований для транзакций и данных взаимодействия, которые выполняются на Hadoop или традиционной сетевой инфраструктуре.

Преобразование данных - это процесс изменения формата данных, чтобы он мог использоваться различными приложениями.Это может означать изменение формата, в котором хранятся данные, в формат, необходимый приложению, которое будет использовать данные. Этот процесс также включает в себя сопоставление команд , так что приложениям сообщается, как получить данные, необходимые для их обработки.

Процесс преобразования данных значительно усложняется из-за ошеломляющего роста количества неструктурированных данных. Бизнес-приложение, такое как управление взаимоотношениями с клиентами, имеет конкретные требования по хранению данных. Данные, вероятно, будут структурированы в организованных строках и столбцах реляционной базы данных. Данные полуструктурированные или неструктурированные , если они не соответствуют жестким требованиям формата.

Информация, содержащаяся в сообщении электронной почты, считается, например, неструктурированной. Некоторые из наиболее важных данных компании - это неструктурированные и полуструктурированные формы, такие как документы, сообщения электронной почты, сложные форматы сообщений, взаимодействия с клиентами, транзакции и информация, поступающая из упакованных приложений, таких как ERP и CRM.

Инструменты преобразования данных не предназначены для работы с неструктурированными данными. В результате компании, которым необходимо внедрить неструктурированную информацию в процесс принятия решений по бизнес-процессам, столкнулись со значительным количеством ручного кодирования для обеспечения требуемой интеграции данных.

Учитывая рост и важность неструктурированных данных для принятия решений, решения ETL от крупных поставщиков начинают предлагать стандартизованные подходы к трансформации неструктурированных данных, чтобы их можно было более легко интегрировать с рабочими структурированными данными.

Роль традиционного ETL в больших данных - манекены

Выбор редактора

Импорт графики в InDesign CS5 Publication - dummies

Импорт графики в InDesign CS5 Publication - dummies

Контент, который вы используете при создании публикаций в InDesign Creative Suite 5 в основном импортируется из других программ. Вы можете импортировать текст, отформатированные таблицы и графику, а затем использовать InDesign для организации, изменения и интеграции текста и графики в макет. Шаги для импорта графических изображений в новый документ InDesign похожи на ...

Импорт изображений в InDesign Creative Suite 5 Документы - манекены

Импорт изображений в InDesign Creative Suite 5 Документы - манекены

Вы можете добавить несколько видов файлов изображений в Документ InDesign CS5. Некоторые из наиболее распространенных форматов для импорта - GIF, JPEG, AI, PSD и TIF. Изображения импортируются в графические рамки. Вы можете создать кадры перед импортом или если у вас нет фрейма, InDesign создает его для вас мгновенно, когда ...

Отступ Текст в InDesign CS5 Публикация - макеты

Отступ Текст в InDesign CS5 Публикация - макеты

Отступ перемещает текст абзаца от левого или правого краев рамка рамки текстового фрейма. Вы можете отступать абзацем, используя панель «Абзац».

Выбор редактора

В электронном виде Отправка копии бухгалтера QuickBooks 2012 Файл данных - манекены

В электронном виде Отправка копии бухгалтера QuickBooks 2012 Файл данных - манекены

Ваш клиент может отправить в электронном виде копию копии бухгалтера QuickBooks 2012 с использованием службы передачи файлов Intuit. Для этого клиент выбирает File → Accountant Copy → Client Activities → Send File. QuickBooks затем предоставляет экранные инструкции по отправке или загрузке копии бухгалтера на сервер Intuit, включая шаги для добавления пароля для защиты загруженного ...

В электронном виде Отправка копии бухгалтера QuickBooks 2013 Файл данных - макеты

В электронном виде Отправка копии бухгалтера QuickBooks 2013 Файл данных - макеты

Ваш клиент может отправить копию копии бухгалтера QuickBooks 2013 в электронном виде с помощью службы передачи файлов Intuit. Для этого клиент выбирает File → Accountant Copy → Client Activities → Send File. QuickBooks затем предоставляет экранные инструкции для отправки или загрузки копии бухгалтера на сервер Intuit, включая шаги для добавления пароля для защиты ...

Экономический добавленный добавленный анализ в действии - манекены

Экономический добавленный добавленный анализ в действии - манекены

Анализ eVA имеет два варианта. Простая версия анализа EVA называется EVA на основе акций, и вы можете использовать информацию, которую вы создаете с помощью QuickBooks для выполнения этого типа анализа EVA. Возьмите gander в нескольких финансовых отчетах - простой отчет о прибылях и убытках и простой баланс. Эти два ...

Выбор редактора

Где в журналистике данных - манекены

Где в журналистике данных - манекены

Данные и истории всегда более важны для некоторых мест, чем другие. Откуда взялась история, и куда она идет? Если вы помните эти важные факты, публикации, которые вы разрабатываете, более актуальны для их предполагаемой аудитории. Где аспект в журналистике данных немного неоднозначен, потому что он может ...

Советы по созданию развертываемых моделей для интеллектуальных аналитических систем - манекены

Советы по созданию развертываемых моделей для интеллектуальных аналитических систем - манекены

, Чтобы обеспечить успешное развертывание интеллектуального анализа модель, которую вы строите, вам нужно будет подумать о развертывании очень рано. У заинтересованных сторон бизнеса должно быть мнение о том, как выглядит окончательная модель. Таким образом, в начале проекта убедитесь, что ваша команда обсуждает требуемую точность предполагаемой модели ...

Роль традиционного ETL в больших данных - манекены

Роль традиционного ETL в больших данных - манекены

Инструменты eTL объединяют три важные функции (извлечение, преобразование , load), необходимые для получения данных из одной большой среды данных и переноса их в другую среду данных. Традиционно ETL использовался с пакетной обработкой в ​​средах хранилища данных. Хранилища данных предоставляют бизнес-пользователям возможность консолидировать информацию для анализа и представления соответствующих данных ...