Оглавление:
- Отчеты электронных таблиц приводят к неэффективным моделям данных
- Плоские файлы данных хорошо подходят для моделей данных
- Табличные наборы данных идеально подходят для моделей данных с поворотным столом
Видео: SEO в 2019: Топ стратегии и основные ошибки – Как продвинуть тревел сайт | Олег Шестаков 2024
В качестве строительного блока для отчетов Excel данные в ваших моделях данных должны быть структурированы соответствующим образом. Не все наборы данных создаются равными. Хотя некоторые наборы данных работают в стандартной среде Excel, они могут не работать для целей моделирования данных. Перед созданием модели данных убедитесь, что исходные данные правильно структурированы для целей сбора данных.
С риском упрощения набора данных, обычно используемых в Excel, входят три основные формы:
-
Отчет о таблицах
-
Плоский файл данных
-
Табличный набор данных
Линия перфорации заключается в том, что для эффективных моделей данных используются только плоские файлы данных и табличные наборы данных.
Отчеты электронных таблиц приводят к неэффективным моделям данных
Отчеты таблиц отображают высокоформатные, обобщенные данные и часто разрабатываются как инструменты представления для руководителей или исполнительных пользователей. Типичный отчет по электронным таблицам делает разумное использование пустого пространства для форматирования, повторяет данные для эстетических целей и представляет собой только анализ на высоком уровне. На следующем рисунке показан отчет по электронным таблицам.
Хотя отчет в электронной таблице может выглядеть красиво, он не делает эффективной модели данных. Зачем? Основная причина заключается в том, что в этих отчетах нет разделения данных, анализа и представления. Вы по существу заперты в один анализ.
Хотя вы можете сделать диаграммы из показанного отчета, было бы нецелесообразно применять какой-либо анализ за пределами того, что уже существует. Например, как вы могли бы рассчитать и представить среднее значение для всех продаж велосипедов с использованием этого конкретного отчета? Как бы вы подсчитали список десяти лучших лучших рынков?
С помощью этой настройки вы вынуждены выполнять очень ручные процессы, которые трудно поддерживать месяц за месяцем. Любой анализ за пределами высокоуровневых уже в отчете является основным в лучшем случае - даже с причудливыми формулами. Кроме того, что происходит, когда вам нужно показывать продажи велосипедов по месяцам? Когда ваша модель данных требует анализа с данными, отсутствующими в отчете электронной таблицы, вы вынуждены искать другой набор данных.
Плоские файлы данных хорошо подходят для моделей данных
Другим типом формата файла является плоский файл. Плоские файлы - это хранилища данных, организованные строкой и столбцом. Каждая строка соответствует набору элементов данных или записи . Каждый столбец является полем . Поле соответствует уникальному элементу данных в записи. Следующий рисунок содержит те же данные, что и предыдущий отчет, но выраженный в формате данных с плоскими данными.
Плоский файл данных.Обратите внимание, что каждое поле данных имеет столбец, и каждый столбец соответствует одному элементу данных. Кроме того, нет дополнительного интервала, и каждая строка (или запись) соответствует уникальному набору информации. Но ключевым атрибутом, который делает этот плоский файл, является то, что ни одно поле однозначно не идентифицирует запись. На самом деле вам нужно будет указать четыре отдельных поля (регион, рынок, бизнес-сегмент и сумма продаж в месяц), прежде чем вы сможете однозначно идентифицировать запись.
Плоские файлы хорошо подходят для моделирования данных в Excel, потому что они могут быть достаточно подробными для хранения необходимых данных и по-прежнему способствуют широкому спектру анализа с помощью простых формул: SUM, AVERAGE, VLOOKUP и SUMIF, только для Назовите несколько.
Табличные наборы данных идеально подходят для моделей данных с поворотным столом
Многие эффективные модели данных управляются главным образом сводными таблицами. Сводные таблицы - это инструменты предварительного анализа Excel. Для тех из вас, кто использовал сводные таблицы, вы знаете, что они предлагают отличный способ обобщить и сформировать данные для использования с помощью компонентов отчетности, таких как диаграммы и таблицы.
Табличные наборы данных идеально подходят для моделей данных с поворотным столом. На следующем рисунке показан табличный набор данных. Обратите внимание, что основное различие между табличным набором данных и плоским файлом данных заключается в том, что в табличных наборах данных метки столбцов не удваиваются как фактические данные. Например, столбец «Период продаж» содержит идентификатор месяца. Это тонкое различие в структуре - то, что делает табличные наборы данных оптимальными источниками данных для сводных таблиц. Эта структура гарантирует, что ключевые функции сводной таблицы, такие как сортировка и группировка, работают так, как должны.
Табличный набор данных.Атрибуты табличного набора данных следующие:
-
Первая строка набора данных содержит метки полей, которые описывают информацию в каждом столбце.
-
Ярлыки столбцов не берут двойной долг в качестве элементов данных, которые могут использоваться в качестве фильтров или критериев запроса (например, месяцев, дат, лет, регионов или рынков).
-
Нет пустых строк или столбцов - каждый столбец имеет заголовок, а значение - в каждой строке.
-
Каждый столбец представляет собой уникальную категорию данных.
-
Каждая строка представляет отдельные элементы в каждом столбце.