【发布时间】:2020-02-04 01:33:34
【问题描述】:
我被要求清理 MongoDB 集合中的数据,我们必须存储地址和通用客户联系数据。
数据偶尔包含回车,当我将数据推送到 MySQL 表时,这往往会破坏加载过程。我的代码使用 Javascript 在关键字段上执行 a replace(/\n//g, '')。但是,数据转储仍然显示混乱,如下所示:
"_id"|"UserID"|"PhoneNumber"|"Source"|"PrivateLabelID"|"OptOut"|"Blocked"|"Deleted"|"Note"|"CreatedAt"|"UpdatedAt"|"FirstName"|"LastName"|"Email"|"Custom1"|"Custom2"|"Custom3"|"Custom4"|"Custom5"|"GroupIDs"
"5e37169df3369f47583355dc"|"127342"|"8645169963"|"1"|"1"|"undefined"|"undefined"|"undefined"|"Timothy.. I mainly buy in the SW area of Florida. Please send me what you have"|"1580668573"|"1580668573"|"Lee"|"Burnside"|"clemsonworldentertainment@gmail.com"|"undefined"|"undefined"|"undefined"|"undefined"|"undefined"|"[object Object]"
"5e3712c6958b2b1896070f2b"|"127342"|"8452063505"|"1"|"1"|"undefined"|"undefined"|"undefined"|"Yes I am looking in the lower to central Florida market. Multi family units."|"1580667590"|"1580667591"|"Daniel "|"Lepore"|"daniellepore@icloud.com"|"undefined"|"undefined"|"undefined"|"undefined"|"undefined"|"[object Object]"
"5e37107f61befe0bea740cfa"|"127342"|"3867770002"|"1"|"1"|"undefined"|"undefined"|"undefined"|"He's with Habib
His last name is not Thompson that Habib name"|"1580667007"|"1580667007"|"Thompson"|""|""|"undefined"|"undefined"|"undefined"|"undefined"|"undefined"|"[object Object]"
"5e370e08853f2702e40828fa"|"127342"|"4073712312"|"1"|"1"|"undefined"|"undefined"|"undefined"|"Indeed we are looking for Buy, Fix and Sell and strong rentals including duplexes, triplexes etc.
"|"1580666376"|"1580666376"|"Gisela "|"Escobar"|"jbetfinancial@gmail.com"|"undefined"|"undefined"|"undefined"|"undefined"|"undefined"|"[object Object]"
"5e3709f351798f62ea228e08"|"127342"|"4077774697"|"1"|"1"|"undefined"|"undefined"|"undefined"|"Yes I am buying in that area or any area in Florida if the numbers are right
only in Flipping houses
“注释”字段是这里的挑战。我运行cat --show-all filename 时,我在每条记录的末尾看到了LF“$”字符以及“Note”字段内。
我尝试了tr '\n' ' ' <filename,但它删除了所有 LF 字符。有没有办法只删除“注释”字段内的 LF 字符?
PS:Raw data file(9 行)如果您想自己检查。
【问题讨论】:
-
你可能需要解释一下!
-
我们需要知道字段中间的实际字符是什么......此时无法判断我们是在谈论dos还是unix文件;我建议将有问题的字段放入自己的文件中,在不可打印字符之前和之后留下几个字符,然后通过
od运行文件,例如,假设样本数据在test.dat中,所以运行@ 987654328@ 并将整个输出放在您的问题中。 -
@markp 我假设他正在寻找一个用空格替换 \n 的正则表达式。但不适用于“\n
-
@user171558,当然,删除一个(或多个)嵌入的 cr/lf 的 ....
标签: javascript mongodb bash newline