Дом Личные финансы Как Suss Stats в ggplot2 в R - манекях

Как Suss Stats в ggplot2 в R - манекях

Оглавление:

Видео: Data Analysis in R by Dustin Tran 2025

Видео: Data Analysis in R by Dustin Tran 2025
Anonim

После данных, сопоставления и геометрии четвертый элемент слоя ggplot2 в R описывает, как следует суммировать данные. В ggplot2 вы ссылаетесь на это статистическое резюме как stat .

Одной из очень удобных функций ggplot2 является ее диапазон функций для суммирования ваших данных на графике. Это означает, что вам часто не нужно предварительно суммировать свои данные. Например, высота баров в гистограмме показывает, сколько наблюдений за чем-то, что у вас есть в ваших данных. Статистическое резюме для этого - подсчет наблюдений. Статистики ссылаются на этот процесс как binning, , а stat по умолчанию для geom_bar () - stat_bin ().

Аналогично тому, как каждая геометрия имеет ассоциированный стат по умолчанию, каждый stat также имеет геометрию по умолчанию.

Итак, это задает вопрос: как вы решаете, использовать ли геометрию или стат? Теоретически неважно, выбираете ли вы первую геометрию или стат. На практике, однако, часто интуитивно сначала начинать с типа сюжета - другими словами, указать геометрию. Если вы хотите добавить еще один уровень статистической сводки, используйте stat.

geom_bar (). "Width =" 535 ">

Создание гистограммы с помощью geom_bar ().

На этом рисунке вы использовали одни и те же данные, чтобы сначала создать диаграмму рассеяния с помощью geom_point (), а затем добавили плавную строку с stat_smooth ()

Здесь приведены некоторые практические примеры использования функций stat.

Stat Описание Геометрия по умолчанию
stat_bin () Подсчитывает количество наблюдений в ящиках. geom_bar ()
stat_smooth () Создает плавную строку. geom_line ()
stat_sum () Добавляет значения. geom_point ()
stat_identity () Нет резюме. Графики данных как есть. geom_point ()
stat_boxplot () Суммирует данные для графика прямоугольника и усы. geom_boxplot ()
> Данные объединения

Вы уже видели, как использовать stat_bin () для суммирования ваших данных в бункерах, потому что это стат по умолчанию geom_bar (). Это означает, что следующие две строки кода производят одинаковые графики: >> ggplot (quakes, aes (x = depth)) + geom_bar (binwidth = 50)> ggplot (quakes, aes (x = глубина)) + stat_bin (binwid th = 50)

Сглаживание данных

Пакет ggplot2 также очень упрощает создание линий регрессии через ваши данные. Вы используете функцию stat_smooth () для создания этого типа строки.

Интересная вещь о stat_smooth () заключается в том, что она использует локальную регрессию по умолчанию. R имеет несколько функций, которые могут это сделать, но ggplot2 использует функцию loess () для локальной регрессии. Это означает, что если вы хотите создать модель линейной регрессии, вы должны сказать stat_smooth (), чтобы использовать другую более плавную функцию.Вы делаете это с помощью аргумента метода.

Чтобы проиллюстрировать использование более плавного, начните с создания диаграммы рассеивания безработицы в длинном наборе данных: >> p p

Затем добавьте более гладкую. Это так же просто, как добавление stat_smooth () в вашу строку кода. >> p + stat_smooth ()

Ваша графика должна выглядеть как график слева от изображения ниже.

Иногда ggplot2 генерирует сообщения с дополнительными советами и информацией. Если вы не видите предупреждения или ошибки, вы можете спокойно проигнорировать эти сообщения. В этом случае stat_smooth () сообщает вам, что более гладким по умолчанию является метод под названием

leess

(локальное сглаживание). В сообщении также говорится, что вы можете использовать альтернативные методы сглаживания.

Наконец, используйте stat_smooth () для подгонки и построения модели линейной регрессии. Вы делаете это, добавляя аргумент method = "lm": >> p + stat_smooth (method = "lm")

Теперь ваша графика должна выглядеть как график справа. stat_smooth (). "Width =" 535 "> Добавление строк регрессии с помощью stat_smooth ().

Ничего не делать с идентификатором

Иногда вы не хотите, чтобы ggplot2 суммировал ваши данные на графике. Это обычно происходит, когда ваши данные уже предварительно скомпилированный или когда каждая строка вашего фрейма данных должна быть построена отдельно. В этих случаях вы хотите сказать ggplot2 ничего не делать, и stat для этого - stat_identity (). Вероятно, вы заметили, что stat_identity статистика по умолчанию для точек и строк.
Как Suss Stats в ggplot2 в R - манекях

Выбор редактора

ASVAB Информация об электронике для электроники: напряжение и электрический ток - макеты

ASVAB Информация об электронике для электроники: напряжение и электрический ток - макеты

Вам нужно знать несколько вещи о напряжении и электрическом токе для подтекста электронной информации ASVAB. Электричество не так сложно, как вы думаете. Проверьте ниже, чтобы подготовиться к этому подтесту. Измерительное напряжение: есть ли у вас потенциал? Схема - это просто электрический ток. Очень ...

ASVAB Практика использования математики: Соотношения - манекены

ASVAB Практика использования математики: Соотношения - манекены

Отношение - это оператор, который показывает, как сравниваются два числа. Когда вы сталкиваетесь с вопросом о соотношении на подтесте математического знания на ASVAB, вы не можете его сначала распознать. Это потому, что вы можете выразить соотношение одним из трех способов: Практические вопросы Выразите соотношение женщин и мужчин как ...

ASVAB Практика использования математики: проценты - манекены

ASVAB Практика использования математики: проценты - манекены

Подтест математики знаний в ASVAB содержит много проблем, связанных с работой с процентами. Хотя вычисление процентов довольно просто, вы обязательно найдете бумагу для царапин и карандаш полезными, как вы увидите в следующих практических вопросах. Практические вопросы 250 - это 40 процентов от числа? A. 650 B. 625 C. 6, 250 D. ...

Выбор редактора

Уменьшение эффекта «красных глаз» в цифровых фотографиях с помощью Flash-манекенов

Уменьшение эффекта «красных глаз» в цифровых фотографиях с помощью Flash-манекенов

Так называемого проблема с красными глазами камеры возникает, когда вспышка отражается в глазах объекта, придавая им красный блеск. Режим уменьшения красных глаз вашей цифровой камеры направлен на то, чтобы помешать этому явлению, включив вспышку с низким энергопотреблением до того, как «настоящая» вспышка погаснет или за несколько секунд загорится маленькой лампой до захвата ...

Переименование цифровых файлов фотографий на вашем компьютере - манекены

Переименование цифровых файлов фотографий на вашем компьютере - манекены

Вам часто нужно переименовывать файлы изображений на вашем компьютере, пока вы работать с вашими цифровыми фотографиями. Переименовывая файлы изображений, вы можете избежать путаницы с вашими цифровыми изображениями. Чтобы переименовать изображение:

Изменение размеров ваших цифровых фотографий - манекенов

Изменение размеров ваших цифровых фотографий - манекенов

Обратите внимание на метод изменения размера, который вы выбираете для своих цифровых фотографий. Например, Photoshop имеет эти параметры изменения размера, которые отображаются в раскрывающемся меню в диалоговом окне «Размер изображения» (показано): Автоматически: выбирает тот, который Photoshop думает, будет работать лучше всего, в зависимости от типа изображения, которое вы изменяете, и независимо от того, «Увеличивать или уменьшать ...

Выбор редактора

SAT Тематический тест История США: борьба за независимость - манекены

SAT Тематический тест История США: борьба за независимость - манекены

Около 20 процентов Тематический тест SAT в истории США охватывает период с 1763 по 1800 год. Большинство экзаменационных вопросов из этого периода времени сосредоточены на политической и экономической истории. Социальные, интеллектуальные, культурные и внешнеполитические вопросы занимают вопросы о власти и деньгах. Скорее всего, вы увидите вопросы, касающиеся ...

Общие вопросы об избирательном праве на участие в экзамене Series 7 - манекены

Общие вопросы об избирательном праве на участие в экзамене Series 7 - манекены

Экзамен серии 7 спросите вас о корпорациях, выпускающих обыкновенные акции (а также другие ценные бумаги) для привлечения капитала. В качестве обеспечения акционерного капитала обыкновенные акции представляют собой собственность на корпорацию-эмитент. Если корпорация выдает 1 млн акций, каждая акция представляет собой миллионную долю в выдающей корпорации. Читайте дальше ...

Обеспеченные ипотечные обязательства Вопросы по экзамену 7 серии - манекены

Обеспеченные ипотечные обязательства Вопросы по экзамену 7 серии - манекены

CMOs или обеспеченные ипотечные обязательства, являются раздражающими мало (или большими) долговыми ценными бумагами, поддерживаемыми пулами ипотечных кредитов и покрываются в Серии 7. Что еще хуже, так это то, что вы, вероятно, не будете продавать один за всю свою карьеру. Однако CMOs являются ценными бумагами, обеспеченными активами, которые рассматриваются на экзамене Series 7, и вам нужно знать ...