Видео: 10 настроек Huawei P30 Pro, которые стоит сразу изменить! 2025
Если у вас есть расфасованный набор данных (набор данных в длинном формате), вы готовы изменить его с помощью R. Чтобы проиллюстрировать, что процесс изменения сохраняет все ваши данные целыми, попробуйте восстановить оригинал: >> dcast (mgoals, Venue + Game ~ variable, sum) Место игры Бабушка Джеральдина Гертруда 1 1-й Брюгге 12 5 11 2 2-й Гент 4 4 5 3 3rd Ghent 5 2 6 4 4th Bruges 6 4 7
Вы видите, как dcast () принимает формулу в качестве второго аргумента? Подробнее об этом через минуту, но сначала проверьте свои результаты. Он должен соответствовать исходному кадру данных.
Вы используете функцию dcast () для создания потока данных. Чтобы быть понятным, вы используете это для преобразования из длинного формата в широкий формат, но вы также можете использовать его для агрегирования в промежуточные форматы, подобно тому, как работает сводная таблица.
Функция dcast () принимает три аргумента:
-
: Распределенный фрейм данных. formula
-
: Формула, которая указывает, как вы хотите использовать данные. Эта формула принимает вид x_variable ~ y_variable. Но это упрощено, чтобы сделать точку. Вы можете использовать несколько x -переменных, несколько y -переменных и даже z -переменных. весело. aggregate
-
: Функция, используемая, если формула литья приводит к агрегации данных (например, length (), sum () или mean ()).
Если вы хотите получите таблицу с местом, на котором заканчиваются строки и игрок по столбцам, ваша формула литья должна быть переменной места: >> dcast (mgoals, переменная места, сумма) Место проведения Бабушка Джеральдина Гертруда 1 Брюгге 18 9 18 2 Гент 9 6 11
На самом деле возможно иметь более сложные формулы литья. Согласно странице справки для dcast () формула литья принимает этот формат:
x_variable + x_2 ~ y_variable + y_2 ~ z_variable ~ …
Обратите внимание, что вы можете комбинировать несколько переменных в каждом измерении со знаком плюс (+), и вы разделяете каждое измерение тильдой (~). Кроме того, если у вас есть две или более тильд в формуле (то есть вы включаете
z
-переменная), ваш результат будет многомерным.
Итак, чтобы получить сводку целей по месту, игроку (переменной) и игре, вы делаете следующее: >> dcast (mgoals, Venue + variable ~ Game, sum) Переменная места 1-я 2-я 3-я 4-я 1 Bruges Granny 12 0 0 6 2 Брюгге Джеральдин 5 0 0 4 3 Брюгге Гертруда 11 0 0 7 4 Гент Бани 0 4 5 0 5 Гент Джеральдина 0 4 2 0 6 Гент Гертруда 0 5 6 0 Одна из причин, по которой вы должны понимать данные в длинном формате, так это то, что обе решетки графических пакетов и ggplot2 широко используют данные в формате long.Преимущество состоит в том, что вы можете легко создавать графики ваших данных, которые сравнивают разные подгруппы.
