【问题标题】:R LSA LSAFUN enconding problemsR LSA LSAFUN 结尾问题
【发布时间】:2017-11-02 09:22:06
【问题描述】:

我想使用包LSAfun 中的genericSummary 函数。这是德语示例文本。

library("LSAfun")
text = " Gegen die Firma wurde während der letzten Woche ein Zwangsvollstreckungsverfahren eingeleitet. Darüber witzeln die Konkurrenten."

我的文本编码是“UTF-8”。实际上,这个示例文本的编码是“latin1”。因此我转换为utf8

text = enc2utf8(text)

当我打电话时

genericSummary(text, k=2)

我收到以下错误:

Error in FUN(X[[i]], ...) : 
  [lsa] - could not open file C:\Users\MA\AppData\Local\Temp\RtmpcRnDPw\file16c81a35d06/sentence1.txt due to encoding problems of the file.

有人知道怎么解决吗?

【问题讨论】:

    标签: r encoding linguistics lsa


    【解决方案1】:

    有同样的问题。似乎像'ü'和'ä'这样的特殊字符是这里的原因。 通过将它们替换为“ue”和“ae”,编码将起作用。

    试试这个: genericSummary(text,k=2, language="german",故障=T)

    故障选项将完成这项工作,另请参阅此功能的 R 帮助。

    亲切的问候, 迈克尔。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-05-19
      • 1970-01-01
      • 2010-11-10
      • 1970-01-01
      • 2021-02-06
      相关资源
      最近更新 更多