【问题标题】:R reading a tsv file using specific encodingR使用特定编码读取tsv文件
【发布时间】:2012-03-19 03:01:10
【问题描述】:

我正在尝试使用特定编码将 .tsv(制表符分隔值)文件读入 R。应该是windows-1252。它有一个标题。

对将其放入数据框的代码有何建议?

【问题讨论】:

    标签: r tsv


    【解决方案1】:

    大概是这样的吧?

    mydf <- read.table('thefile.txt', header=TRUE, sep="\t", fileEncoding="windows-1252")
    str(mydf)
    

    【讨论】:

      【解决方案2】:

      你也可以使用:

      read.delim('thefile.txt', header= T, fileEncoding= "windows-1252")

      只需将命令输入到您的 R 控制台中:

       > read.delim
      function (file, header = TRUE, sep = "\t", quote = "\"", dec = ".", 
          fill = TRUE, comment.char = "", ...) 
      read.table(file = file, header = header, sep = sep, quote = quote, 
          dec = dec, fill = fill, comment.char = comment.char, ...)
      

      显示read.delim 是一个打包的read.table 命令,它已经将制表符指定为数据的分隔符。如果您处理大量 tsv 文件,read.delim 可能会更方便。

      这两个命令的区别在in this Stack question有更详细的讨论。

      【讨论】:

        【解决方案3】:

        df &lt;- read.delim(~/file_directory/file_name.tsv, header = TRUE) 将适用于单个 .tsv 文件,因为它已经被 tab 分隔,因此不需要 sep = "\t"fileEncoding= "windows-1252" 可以使用但不是必需的。

        【讨论】:

          猜你喜欢
          • 2021-05-31
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 2014-12-06
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          相关资源
          最近更新 更多