Видео: Как сравнить два списка Excel. Способ 1 с помощью сводной таблицы 2024
Другим полезным приложением подмножеств данных является поиск и удаление строк с отсутствующими данными. Функция R для проверки на это завершена. случаи (). Вы можете попробовать это на основе встроенного набора данных airquality, кадра данных с достаточным количеством недостающих данных: >> str (airquality)> complete. случаи (airquality)
Результаты полного. cases () - это логический вектор со значением TRUE для завершенных строк и FALSE для строк с некоторыми значениями NA. Чтобы удалить строки с отсутствующими данными из airquality, попробуйте выполнить следующее:
Как всегда с R, существует более одного способа достижения вашей цели. В этом случае вы можете использовать na. omit (), чтобы опустить все строки, содержащие значения NA: >> x <- na. omit (airquality)
Когда вы уверены, что ваши данные чистые, вы можете начать анализировать их, добавив вычисленные поля.
Если вы используете какой-либо из этих методов для подмножества ваших данных или очистки отсутствующих значений, не забудьте сохранить результат в новом объекте. R не изменяет ничего в исходном кадре данных, если вы явно не перезаписали его. Это хорошо, потому что вы не можете случайно испортить свои данные.