【问题标题】:How is readxl misreading an excel xlsx file and how to fix it?readxl 如何误读 excel xlsx 文件以及如何修复它?
【发布时间】:2020-01-25 05:02:52
【问题描述】:

我正在尝试下载并阅读 2016 年堪萨斯州立大学教师人数的 xlsx 文件。

https://www.k-state.edu/pa/faculty/demographics/total/index.html

tibble创建时,部分数字与原始excel文件不匹配。

url <- "https://www.k-state.edu/pa/faculty/demographics/total/t2016.xlsx"

download.file(url, destfile = "t2016.xlsx",  mode = "wb")

library(readxl)

kansas_state <- read_xlsx("t2016.xlsx", skip = 165, col_names = FALSE)

gender <- kansas_state[1:4]
names(gender) <- c("COLLEGE", "N", "Male", "F")
gender

我正在阅读 Excel 表格中的最后一张表格,其中包含每个学院的总数。

然后,如果您打开 excel 文件并查看最后一个表格“大学总数”,有些数字不匹配。比如农学院,但是建筑学院……?

我还在这里分享了这个例子的 rstudio 项目的 github 公共链接:

https://github.com/AdamUArk/r_readxl_example

【问题讨论】:

    标签: r excel xlsx readxl


    【解决方案1】:

    此文件中有隐藏的工作表,因此read_xlsx() 从其中一张工作表中读取,而不是您通常看到的工作表。要阅读您想要的内容,请将sheet = 'Totals' 添加到read_xlsx() 的参数中。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-04-14
      • 1970-01-01
      • 2022-11-20
      相关资源
      最近更新 更多