【发布时间】:2017-08-10 21:06:13
【问题描述】:
我正在处理一个相当大的文件,我将使用它来创建 word2vec 嵌入。该文件每行包含一个句子,所有行都以 开始标记和 结束标记开始。现在我想做的是使用 sed 删除开始和结束标签,但我不知道该怎么做。
我试过了
sed myfile 's/<s> //g' > resultfile
sed resultfile 's/ </s>//g' > finalfile
但这会产生“命令后的额外字符”错误。
如果有人能给我正确的模式,我会非常高兴。提前致谢!
【问题讨论】: