Оглавление:
- Наиболее используемые квантили являются фактически 0-процентным и 100-процентным квантилями. Вы могли бы так же легко назвать их минимумом и максимумом, потому что это то, что они есть. Вы можете использовать функции min () и max () вместе с помощью функции range (). Эта функция удобно предоставляет вам диапазон данных. Таким образом, чтобы узнать, между которыми расположены два значения всех миль, вы просто делаете следующее:
- квартилях
- Все эти функции имеют аргумент na. rm, который позволяет удалить все значения NA перед вычислением соответствующей статистики. Если вы этого не сделаете, любой вектор, содержащий NA, будет иметь NA. Это работает одинаково с na. rm аргумента функции sum ().
Видео: Восстановление файлов через R-Studio 2025
Единственное число не говорит вам о ваших данных. Часто важно знать распространение ваших данных. Вы можете использовать R, чтобы посмотреть на этот разброс, используя несколько разных подходов.
Во-первых, вы можете рассчитать либо дисперсию , либо стандартное отклонение , чтобы суммировать спред в одном числе. Для этого у вас есть удобные функции var () для дисперсии и sd () для стандартного отклонения. Например, вы вычисляете стандартное отклонение переменной mpg в кадре данных так:
Рядом со средним значением и вариацией вы также можете взглянуть на квантили. A
quantile, или процентиль, сообщает вам, сколько ваших данных находится ниже определенного значения. Например, 50-процентный квантиль - это не что иное, как медиана. Опять же, R имеет некоторые удобные функции, которые помогут вам взглянуть на квантили. Как рассчитать диапазон данных в R
Наиболее используемые квантили являются фактически 0-процентным и 100-процентным квантилями. Вы могли бы так же легко назвать их минимумом и максимумом, потому что это то, что они есть. Вы можете использовать функции min () и max () вместе с помощью функции range (). Эта функция удобно предоставляет вам диапазон данных. Таким образом, чтобы узнать, между которыми расположены два значения всех миль, вы просто делаете следующее:
Диапазон по-прежнему дает вам только ограниченную информацию. Часто статистики сообщают о первом и третьем
квартилях
рядом с диапазоном и медианной. Эти квартили представляют собой соответственно 25 и 75 процентов квантилей, которые являются числами, для которых одна четвертая и три четверти данных меньше. Вы получаете эти числа, используя функцию quantile (), например:
Функция quantile () может дать вам любой квантиль, который вы хотите. Для этого вы используете аргумент probs. Вы даете вероятности (или вероятности) как дробное число. Например, для 20-процентного квантиля вы используете 0. 20 в качестве аргумента для значения.Этот аргумент также принимает вектор как значение, поэтому вы можете получить, например, 5 и 95 процентов квантилей следующим образом: >> quantile (cars $ mpg, probs = c (0. 05, 0. 95)) 5% 95% 11. 995 31. 300
Значение по умолчанию для аргумента probs представляет собой вектор, представляющий минимум (0), первый квартиль (0. 25), медианный (0. 5), третий квартиль (0. 75) и максимум (1).