【发布时间】:2021-03-09 22:54:00
【问题描述】:
我正在使用 R 创建数据集。我在下面提供了一个信息列表,作为单列 xls 提供。我想将此列表更改为数据集(data.frame?),其列名如下所示。我将获得更多包含新列表的 xls 文档,但是虽然列名将始终保持不变,但它们下面的行将随着新数据的添加而变化(始终按以下顺序)。自动化数据导入并将新信息添加到现有数据集(假设它们是多个 xls 文件)的最简单方法是什么?
Name:
Jon Doe
City:
Chicago
State:
IL
Zip:
60007
Angler Class:
Male
Fish Information:
Date Caught:
09/13/1999
Time:
8 pm
Length:
12.00 Inches
Weight:
Not Specified
Girth:
Not Specified
Fish Depth:
9 Feet
Lake Depth:
Not Specified
Kept/Release:
Released
Species:
Bass
Weather Information:
Sky:
Clear
Wind Direction:
South West
Wind Speed:
Strong
Lake Information:
Lake Name:
Pewaukee Lake
County:
Waukesha
State:
Wisconsin
Lake Bottom:
Junk Weeds
Structure:
Not Specified
Lure Information:
Lure Name:
Rapala
Primary Color:
Black
Secondary Color:
Not Specified
Presentation:
Casting
我想要的输出:
| Name | City | State | Zip | Date Caught | Time | Species | Lure Name | Lake Name | State |
|---|---|---|---|---|---|---|---|---|---|
| Jon Doe | Chicago | IL | 60007 | 09/13/1999 | 8 pm | Bass | Rapala | Pewaukee Lake | Wisconsin |
| Jane Doe | Pittsburgh | PA | 15237 | 08/15/1999 | 6 pm | Bass | Jig | Lake St. Clair | Michigan |
*请注意,“state”在列表中使用了两次,分别表示垂钓者州和湖泊州。我想在我的桌子上将其捕获为“angle_state”/“lake_state”。
【问题讨论】:
-
每个文件是否仅限于一个人?
-
如果每个文件只有 1 个名称,请使用
matrix()函数,然后使用as.data.frame()将矩阵转换为数据框。 -
如果有一些列缺少响应,有没有办法让
matrix在这里工作?此处 Fish/Weather/Lake/Lure Information 的列名称会直接跳到下一个,因为可能是数据未填充。
标签: r dataframe dplyr tidyverse