【发布时间】:2016-01-23 02:17:20
【问题描述】:
我是 R 的新用户。我需要您的建议 - 我有大约 100 个 csv 文件。每个文件中的列数可以更改。我正在寻找帮助识别每个文件中“唯一列”的数量 - (如果文件有重复的列,我希望它算作 1 个唯一列)
file1.csv
a,b,c,d
1,2,0,4
2,0,3,5
3,0,4,6
4,8,7,0
file2.csv
a,b,c,d,c
1,2,0,3,0
2,3,4,5,4
3,6,2,0,2
4,2,3,5,3
所以从技术上讲,代码应该为 file1.csv 提供 4 列(a、b、c、d),为 file2.csv 提供 4 列(a、b、c、d - c 列重复)。我知道使用 dim(df)[2] 会给我每个文件中的列数,但如果我必须为 100 个文件执行此操作,我应该怎么做?
【问题讨论】:
-
谢谢 nrussel,你是怎么安排这些桌子的?
-
我只是将它们格式化为代码 - 选择一段文本并单击花括号符号 (
{}) 或按 Ctrl+K。 -
当有重复的列时,列名是否也总是重复?
-
如果它是重复的列,那么是的,名称也会重复
标签: r