【发布时间】:2020-05-05 21:36:46
【问题描述】:
我有一个问题,我在 csv 文件中有 20+k 行,我正在尝试根据 Mongo DB 中包含 350k 文档的匹配字段的文档来更新它们。
诀窍是我需要对匹配执行一些逻辑,然后重新更新 csv。
我正在使用 PapaParse 解析/解解析 csv 文件
做一些类似的事情来获得我所有的比赛
const file = fs.createReadStream('INFO.csv');
Papa.parse(file, {
header: true,
complete: function(row) {
getMatchesAndSave(row.data.map(el => { return el.fieldToMatchOn }));
}
});`
function getMatchesAndSave(fields) {
Order.find({fieldToMatchOn: { $in: fields}}, (err, results) => {
if (err) return console.error(err);
console.log(results);
});
}
这让我快速匹配。但是,我不能真正将我的数据合并回 csv bc,因为 csv 有一个 Mongo 不知道的唯一键列。
所以所有数据实际上都取决于 csv 中的内容。
因此我想到了做这样的事情
`
const jsonToCSV = [];
for (let row of csvRows) {
db.Collection.find({fieldToMatchOn: row.fieldToMatchOn}, (err, result) => {
//Add extra data to row based on result
row.foo = result.foo;
//push to final output
jsonToCSV.push(row);
}
}
papa.unparse(jsonToCSV);
//save csv to file
上述实现的问题(看起来效率极低) - 是 Find 调用是异步的,没有任何东西被推送到 jsonToCSV。
有什么建议吗?用 $in 解决这个问题是理想的,有什么方法可以访问 $in 中的当前元素(所以寻找迭代器)..那样我可以处理它。
【问题讨论】:
-
尝试使用异步等待获取结果,然后将其推送到 jsonToCSV 数组。
-
请提供一个例子。我看到在很多帖子中使用 asyn await ,但它似乎不起作用。我认为这是由于for
标签: javascript json mongodb csv papaparse