Видео: Лекция 1. Примеры применения анализа данных, стандартные задачи и методы 2024
Данные, собранные крупными организациями в ходе повседневной деятельности, обычно хранятся в базах данных. Но администраторы баз данных могут не захотеть разрешить непосредственным пользователям данных источники данных и прямой доступ могут быть не лучшим выбором с вашей точки зрения. Прямой доступ к операционным (используемым для обычных бизнес-операций) базам данных может быть плохой идеей, потому что
-
Data-шахтеры используют множество данных. > Вы можете непреднамеренно связать ресурсы и вмешиваться в обычные бизнес-операции.
-
Вы можете непреднамеренно нарушить закон о конфиденциальности данных или другое управление данными если ваш доступ к данным не контролируется должным образом. Операционные базы данных не организованы для интеллектуального анализа данных.
-
Вы можете потратить много времени на поиск необходимых данных и не будете уверены в правильности их использования. Когда вам нужны данные из оперативную базу данных (и у вас есть соответствующее разрешение на использование данных), вы должны обсудить свои потребности с администратором, ответственным за эти данные. Вам нужно будет точно указать, какие данные вам нужны, формат, необходимый для интеллектуального анализа данных, и нужны ли вам данные только один раз или на постоянной основе.
Постоянный доступ к данным - это другой вопрос. Администратор может не захотеть повторно предоставлять извлечение данных, а предоставление прямого доступа к бизнес-системам является рискованным. Общим решением является создание аналитической базы данных
. Это обычная реляционная база данных, которая отделена от обычных бизнес-систем. Данные регулярно (и автоматически) передаются из бизнес-систем в аналитическую базу данных, и данные могут получить доступ к ним в любое время.
Если администратор базы данных настаивает на том, что данные не могут быть сохранены таким образом, спросите, возможно ли создать представление
(хранимый запрос, который можно запросить, как если бы это была обычная таблица данных) с организацией, которая вам нужна. Многие продукты для интеллектуального анализа данных могут считывать данные из баз данных. Необходимые шаги зависят от
Проекта приложения для интеллектуального анализа данных
-
Структура исходной базы данных
-
Middleware, обычно называемая драйвером
-
( драйвер ODBC, драйвер JDBC <), специальное программное обеспечение, которое посредничает между базой данных и прикладным программным обеспечением Документация для вашего приложения для интеллектуального анализа данных должна сообщить вам, может ли он считывать данные из базы данных, и если да, то какой инструмент или функция использовать и как.Администратор, создающий базу данных аналитики, может предоставить сведения о доступе к базе данных. Если вы уже комфортно работаете с базами данных и другими приложениями, вы не найдете ничего удивительного в том, чтобы делать то же самое с приложением для интеллектуального анализа данных. Если базы данных новы для вас, узнайте у специалиста из вашей организации, чтобы пройти через процесс с помощью собственной базы данных и приложения для интеллектуального анализа данных.