Видео: R: Загрузка данных из внешних источников 2025
Возможно, вы захотите объединить данные из разных источников в своем анализе. Вообще говоря, вы можете использовать R для объединения разных наборов данных тремя способами:
-
Добавление столбцов: Если два набора данных имеют одинаковый набор строк, а порядок строк одинаковый, то добавление столбцов имеет смысл. Ваши варианты для этого - данные. frame или cbind ().
-
Добавление строк: Если оба набора данных имеют одинаковые столбцы, и вы хотите добавить строки в нижнюю часть, используйте команду rbind ().
-
Объединив данные с различными формами: Функция merge () объединяет данные на основе общих столбцов, а также общих строк. В языке баз данных это обычно называется соединением данных.
Вы используете merge (), чтобы найти пересечение, а также объединение разных наборов данных. Вы также смотрите на другие способы работы с поисковыми таблицами, используя функции match () и% in%.
Иногда вы хотите объединить данные, где не просто просто добавить столбцы или строки. Возможно, вы хотите объединить данные на основе значений существующих ключей в данных. Здесь функция merge () полезна. Вы можете использовать merge () для объединения данных только при выполнении определенных условий соответствия.
Скажем, например, у вас есть информация о государствах в стране. Если один набор данных содержит информацию о населении, а другой содержит информацию о регионах, и у обоих есть информация о названии состояния, вы можете использовать merge () для объединения ваших результатов.
