Оглавление:
- Как сравнить два образца данных
- В большинстве случаев вы не хотите сравнивать два образца друг с другом, но сравниваете образец с теоретическим образцом, который происходит из определенного распределения (например, нормального распределения).
Видео: Вконтакте моя страница как оформить для бизнеса. Бизнес Вконтатке. Продвижение в соцсетях #001 2024
Гистограммы оставляют много для интерпретации зрителя. Лучший графический способ в R, чтобы определить, правильно ли распределены ваши данные, - это посмотреть на так называемый квантиль-квантиль (QQ).
С помощью этой техники вы создаете квантиль друг против друга. Если вы сравниваете два образца, например, вы просто сравниваете квантили обоих образцов. Или, говоря немного иначе, R делает следующее для построения графика QQ:
-
Он сортирует данные обоих образцов.
-
Он отображает эти отсортированные значения друг против друга.
Если оба образца не содержат одинакового числа значений, R вычисляет дополнительные значения путем интерполяции для наименьшего образца для создания двух образцов одного и того же размера.
Как сравнить два образца данных
Конечно, вам не нужно это делать самостоятельно, вы можете просто использовать функцию qqplot () для этого. Итак, чтобы проверить, распределены ли температуры во время активности и во время отдыха одинаково, вы просто выполняете следующее:
Это создает график, на котором построены упорядоченные значения друг против друга.
Между квадратными скобками вы можете использовать логический вектор для выбора случаев, которые вы хотите. Здесь вы выбираете все случаи, когда переменная activ равна 1 для первого образца, и все случаи, когда эта переменная равна 0 для второго образца.
В большинстве случаев вы не хотите сравнивать два образца друг с другом, но сравниваете образец с теоретическим образцом, который происходит из определенного распределения (например, нормального распределения).
Чтобы сделать такой график QQ, R имеет специальную функцию qqnorm (). Как следует из названия, эта функция отображает ваш образец против нормального распределения. Вы просто даете образец, который хотите построить в качестве первого аргумента, и добавьте любые графические параметры, которые вам нравятся.
Затем R создает образец со значениями, исходящими из стандартного распределения
стандартного распределения , или нормального распределения со средним значением нуля и стандартным отклонением от него. С этим вторым образцом R создает график QQ, как объяснялось ранее. R также имеет функцию qqline (), которая добавляет строку в ваш обычный график QQ. Эта линия значительно облегчает оценку того, видишь ли вы явное отклонение от нормальности. Чем ближе все точки к линии, тем ближе распределение вашего образца доходит до нормального распределения. Функция qqline () также принимает образец в качестве аргумента.
Теперь вы хотите сделать это для температур во время активного и неактивного периода бобра. Вы можете использовать функцию qqnorm () дважды, чтобы создать обе графики. Для неактивных периодов вы можете использовать следующий код: >> qqnorm (beaver2 $ temp [beaver2 $ activ == 0], main = "Inactive")> qqline (beaver2 $ temp [beaver2 $ activ == 0])
Вы можете сделать то же самое для активного периода, изменив значение от 0 до 1.