【发布时间】:2016-06-06 13:05:46
【问题描述】:
我在 R 中有这个数据表(47541025 行):
require(data.table)
DT<-fread("pmiDistances.csv")
head(DT)
language 1 language 2 distance
1: Kho.CENTRAL_KHOISAN.GWI Kho.CENTRAL_KHOISAN.GWI 0.0000000
2: Kho.CENTRAL_KHOISAN.GWI Kho.CENTRAL_KHOISAN.GXANA 0.2195843
3: Kho.CENTRAL_KHOISAN.GWI Kho.CENTRAL_KHOISAN.KHOEKHOEGOWAB 0.6749363
4: Kho.CENTRAL_KHOISAN.GWI Kho.CENTRAL_KHOISAN.KHWE 0.6089206
5: Kho.CENTRAL_KHOISAN.GWI Kho.CENTRAL_KHOISAN.KORANA 0.7163111
6: Kho.CENTRAL_KHOISAN.GWI Kho.CENTRAL_KHOISAN.KWADI 0.8017179
所以这基本上是一个图表的几个节点及其距离的列表
我有兴趣提取具有 41 种语言的倒数距离的子集,我已将其保存在 .txt 文件中
最聪明的方法是什么? (我不认为 2 个嵌套的 for 循环会起作用)
【问题讨论】:
-
你的倒数距离是什么意思,你能显示几行 .txt 文件吗?
-
我的错,只是两种语言之间的距离! .txt 文件只是我感兴趣的语言的 1 列列表
-
DT[language1 %in% fortyOneLanguages & language2 %in% fortyOneLanguages ,]?
标签: r database data.table subset