Дом Личные финансы Как удалить повторяющиеся данные в R-образцах

Как удалить повторяющиеся данные в R-образцах

Видео: Поиск повторяющихся записей в запросах Access 2024

Видео: Поиск повторяющихся записей в запросах Access 2024
Anonim

Очень полезным приложением данных подмножества является поиск и удаление повторяющихся значений. R имеет полезную функцию duplicated (), которая находит повторяющиеся значения и возвращает логический вектор, который сообщает вам, является ли конкретное значение дубликатом предыдущего значения. Это означает, что для дублированных значений duplicated () возвращает FALSE для первого вхождения и TRUE для каждого следующего появления этого значения, как в следующем примере:

>> duplicated (c (1, 2, 1, 3, 1, 4)) [1] FALSE FALSE TRUE FALSE TRUE FALSE
Если вы попробуете это в кадре данных, R автоматически проверяет наблюдения (это означает, что каждая строка рассматривается как значение). Так, например, с фреймом данных iris: >> duplicated (iris) [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE [10] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE … [136] FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE [145] FALSE FALSE FALSE FALSE FALSE FALSE

Если вы внимательно посмотрите, вы заметите, что строка 143 является дубликатом (потому что 143-й элемент вашего результата имеет значение TRUE). Вы также можете сказать это, используя функцию ():


>> которые (дублируются (ирис)) [1] 143

Теперь, чтобы удалить дубликат из диафрагмы, вы должны исключить эту строку из своих данных. Помните, что есть два способа исключить данные с помощью подмножества:

Укажите логический вектор, где

FALSE

означает, что элемент будет исключен.
  • The! (восклицательный знак) является логическим отрицанием. Это означает, что он преобразует TRUE в FALSE и наоборот. Итак, чтобы удалить дубликаты из диафрагмы, вы делаете следующее:

    >> iris [! duplicated (iris),] Укажите отрицательные значения. Другими словами:

    >> index iris [-index,]
    В обоих случаях вы заметите, что ваша команда удалила строку 143.
    
Как удалить повторяющиеся данные в R-образцах

Выбор редактора

Обращая внимание на поводок вашей собаки во время фотосъемки - манекены

Обращая внимание на поводок вашей собаки во время фотосъемки - манекены

Поводка является обязательным элементом во время любого фотосессию с вашей собакой, где вы находитесь снаружи или в открытой местности. Вы, вероятно, не обращаете много внимания на поводку своей собаки изо дня в день, но положите ее на подушку посреди своего кадра, и у вас будет белая вырезка, которую вы хотите ...

Управление основными моментами и тенями в фотографии продуктов питания - манекены

Управление основными моментами и тенями в фотографии продуктов питания - манекены

Работа с подсветкой и тенями в ваших изображениях пищи может быть несколько сложной задачей. В пищевой фотографии рефлекторы и диффузоры - один из замечательных способов решения этих проблем. Первым шагом является осознание проблем, когда вы делаете пробные снимки или проверяете свои снимки. Если вы видите подсветку ...

С AEB или ручным режимом в HDR - манекенами

С AEB или ручным режимом в HDR - манекенами

С использованием предустановленной стратегии брекетинга в высоком динамическом диапазоне ( HDR), но недостаток не знает, действительно ли вы захватываете полный динамический диапазон сцены с помощью скобок (если вы обратите внимание на живую гистограмму, вы ближе к знанию). Более увлекательный подход основан на измерении максимумов и минимумов ...

Выбор редактора

Как удалить строки с отсутствующими данными в R - манекенах

Как удалить строки с отсутствующими данными в R - манекенах

Другое полезное приложение подмножеств данных для поиска и удаления строк с отсутствующими данными. Функция R для проверки на это завершена. случаи (). Вы можете попробовать это на основе встроенного набора данных airquality, кадра данных с достаточным количеством недостающих данных:> str (airquality)> complete. случаи (airquality) Результаты полного. cases () является логическим ...

Как перерабатывать аргументы в R-манекенах

Как перерабатывать аргументы в R-манекенах

Каждый раз вы объединяете вектор с несколькими значениями и один с одно значение в функции. R применяет эту функцию, используя это единственное значение для каждого значения в векторе. Но рециркуляция выходит далеко за рамки этих примеров. Каждый раз, когда вы передаете два вектора с неравной длиной в функцию рециркуляции, R повторяет ...

Как удалить повторяющиеся данные в R-образцах

Как удалить повторяющиеся данные в R-образцах

Очень полезным приложением подмножества данных является поиск и удаление повторяющиеся значения. R имеет полезную функцию duplicated (), которая находит повторяющиеся значения и возвращает логический вектор, который сообщает вам, является ли конкретное значение дубликатом предыдущего значения. Это означает, что для дублированных значений duplicated () возвращает FALSE для первого ...

Выбор редактора

Как создать бесплатную учетную запись FamilySearch - макеты

Как создать бесплатную учетную запись FamilySearch - макеты

FamilySearch - крупнейший некоммерческий генеалогический веб-сайт. Он спонсируется Церковью Иисуса Христа Святых последних дней, но вам не обязательно быть членом церкви, чтобы использовать ее. Свободные ресурсы, доступные на сайте, включают в себя область фотосъемки, семейное дерево в Интернете и коллекцию записей, содержащих больше ...

Как найти людей в индексах подписки - манекены

Как найти людей в индексах подписки - манекены

На нескольких сайтах подписки есть индексы переписи, которые связаны с соответствующие цифровые изображения. Будьте осторожны при использовании этих индексов. Не все индексы включают каждого человека в перепись. Некоторые из них - просто индексы для домашнего хозяйства. Итак, неплохо прочитать описание, которое приходит с индексом, чтобы узнать, как это сделать ...

Как привести свои источники в предках. com-dummies

Как привести свои источники в предках. com-dummies

Источник - это любой материал (например, книга, документ, запись или периодика), который предоставляет информацию для вашего исследования генеалогии. В родословной. com (или любое другое программное обеспечение, которое вы используете), вы должны привести источники всех фактов и информации, которые вы вводите в профили вашего генеалогического древа. Отслеживание источников помогает вам запомнить, где ...