Видео: РЕГРЕССИОННЫЙ АНАЛИЗ общая идея | АНАЛИЗ ДАННЫХ #16 2024
Модель данных обеспечивает основу, на которой построен механизм отчетности Excel. Одним из наиболее важных понятий в модели данных является разделение данных, анализ и представление. Основная идея заключается в том, что вы не хотите, чтобы ваши данные стали слишком привязаны к какому-либо конкретному способу представления этих данных.
Чтобы обдумать эту концепцию, подумайте о счете. Когда вы получаете счет-фактуру, вы не считаете, что финансовые данные на счете-фактуре являются истинным источником ваших данных. Это просто представление данных, которые фактически хранятся в базе данных. Эти данные могут быть проанализированы и представлены вам многими другими способами: в диаграммах, таблицах или даже на веб-сайтах. Это звучит очевидно, но пользователи Excel часто объединяют данные, анализ и презентацию.
Например, некоторые книги Excel содержат 12 вкладок, каждый из которых представляет месяц. На каждой вкладке перечислены данные за этот месяц вместе с формулами, сводными таблицами и сводки. Теперь, что происходит, когда вас просят предоставить сводку по кварталу? Добавляете ли вы дополнительные формулы и вкладки для консолидации данных на каждой вкладке месяца? Основная проблема в этом сценарии заключается в том, что вкладки фактически представляют значения данных, которые слиты в презентацию вашего анализа.
Для примера, следующего в соответствии с отчетностью, взгляните на следующий рисунок. Таблицы с жестким кодом, подобные этой, являются общими. Эта таблица является объединением данных, анализа и представления. Эта таблица не только привязывает вас к конкретному анализу, но и прозрачность в том, что представляет собой анализ, практически отсутствует. Кроме того, что происходит, когда вам нужно сообщать по кварталам или когда требуется другое измерение анализа? Вы импортируете таблицу, состоящую из большего количества столбцов и строк? Как это влияет на вашу модель?
Альтернативой является создание трех слоев в вашей модели данных: уровня данных, уровня анализа и уровня представления. Вы можете думать об этих слоях как о трех разных электронных таблицах в книге Excel: один лист для хранения необработанных данных, которые подают ваш отчет, один лист служит в качестве промежуточной области, где данные анализируются и формируются, а один лист служит уровень представления. Этот рисунок иллюстрирует три уровня эффективной модели данных:
Эффективная модель данных разделяет данные, анализ и представление.Как вы можете видеть, исходный набор данных находится на собственном листе.Хотя набор данных имеет некоторый уровень агрегирования, применяемый для того, чтобы держать его управляемо малым, дальнейший анализ не проводится в Листе данных.
Уровень анализа состоит в основном из формул, которые анализируют и извлекают данные из слоя данных в форматированные таблицы, обычно называемые промежуточными таблицами . Эти промежуточные таблицы в конечном итоге подают компоненты отчетности на уровне презентации. Короче говоря, лист, содержащий слой анализа, становится промежуточной областью, где данные суммируются и формируются для подачи компонентов отчетности. Обратите внимание, что на вкладке «Анализ» строка формул показывает, что таблица состоит из формул, которые ссылаются на вкладку «Данные».
Для этой настройки есть несколько преимуществ. Во-первых, всю модель отчетности можно легко обновить, просто заменив необработанные данные на обновленный набор данных. Формулы на вкладке «Анализ» продолжают работать с последними данными. Во-вторых, любой дополнительный анализ можно легко создать, используя различные комбинации формул на вкладке «Анализ». Если вам нужны данные, которых нет в листе данных, вы можете легко добавить столбец в конец необработанного набора данных, не нарушая листы анализа или презентации.
Вам необязательно размещать ваши данные, аналитические и презентационные слои на разных электронных таблицах. В небольших моделях данных вам может быть проще разместить ваши данные в одной области электронной таблицы, а при создании промежуточных таблиц в другой области одной и той же таблицы.
В тех же строках помните, что вы не ограничены тремя таблицами. То есть вы можете иметь несколько листов, которые предоставляют необработанные данные, несколько анализируемых листов и несколько, которые служат в качестве уровня представления.
Где бы вы ни размещали разные слои, имейте в виду, что идея остается прежней. Уровень анализа должен состоять, прежде всего, из формул, которые извлекают данные из листов данных в промежуточные таблицы, используемые для подачи презентации.