Видео: Загрузка таблиц .csv и .xls и простейшие запросы по их анализу в R Studio 2024
Один из самых простых и надежных способы получения данных в R - использовать текстовые файлы, в частности CSV (значения, разделенные запятыми). Формат файла CSV использует запятые для разделения различных элементов в строке, и каждая строка данных находится в своей строке в текстовом файле, что делает файлы CSV идеальными для представления табличных данных.
Дополнительное преимущество CSV-файлов заключается в том, что почти любое приложение данных поддерживает экспорт данных в формат CSV. Это, безусловно, относится к большинству приложений для работы с электронными таблицами, включая Microsoft Excel и OpenOffice Calc.
В следующих примерах предположим, что у вас есть файл CSV, хранящийся в удобной папке в вашей файловой системе. Чтобы преобразовать таблицу Excel в формат CSV, вам нужно выбрать «Файл» → «Сохранить как», в котором вы можете сохранить файл в различных форматах.
Имейте в виду, что файл CSV может представлять только один рабочий лист электронной таблицы. Наконец, не забудьте использовать самую верхнюю строку вашего листа (строка 1) для заголовков столбцов.
В R вы используете чтение. csv () для импорта данных в формате CSV. Эта функция имеет несколько аргументов, но единственным существенным аргументом является файл, который определяет местоположение и имя файла. Чтобы прочитать файл, называемый элементами. csv находится по адресу f: use read. csv () с файлом. path: >> elements str (elements) '. frame ': 10 obs. из 9 переменных: $ Atomic. номер: int 1 2 3 4 5 6 7 8 9 10 $ Название: Фактор с 10 уровнями «Бериллий», «Борон», …: 6 5 7 1 2 3 9 10 4 8 $ Символ: Фактор с 10 уровнями " B "," Be "," C "," F ", …: 5 6 7 2 1 3 8 10 4 9 $ Группа: int 1 18 1 2 13 14 15 16 17 18 $ Период: int 1 1 2 2 2 2 2 2 2 2 $ Блок: коэффициент w / 2 уровня «p», «s»: 2 2 2 2 1 1 1 1 1 1 $ State. в. STP: Фактор с 2 уровнями «Газ», «Твердый»: 1 1 2 2 2 2 1 1 1 1 $ Появление: Фактор с 1 уровнем «Изначальный»: 1 1 1 1 1 1 1 1 1 1 $ Описание: Фактор с 6 уровнями «Щелочной металл», …: 6 5 1 2 4 6 6 6 3 5
R импортирует данные в фрейм данных. Как вы можете видеть, этот пример содержит десять наблюдений за девятью переменными.
Эта опция по умолчанию для преобразования строк в факторы при использовании чтения. table () может быть источником большой путаницы. Вам часто лучше импортировать данные, содержащие строки таким образом, чтобы строки не были преобразованными факторами, но остаются символьными векторами.Чтобы импортировать данные, содержащие строки, используйте строки аргументовAsFactors = FALSE для чтения. csv () или читать. table ():