readxl 如何误读 excel xlsx 文件以及如何修复它？答案

【问题标题】：How is readxl misreading an excel xlsx file and how to fix it?readxl 如何误读 excel xlsx 文件以及如何修复它？
【发布时间】：2020-01-25 05:02:52
【问题描述】：

我正在尝试下载并阅读 2016 年堪萨斯州立大学教师人数的 xlsx 文件。

https://www.k-state.edu/pa/faculty/demographics/total/index.html

tibble创建时，部分数字与原始excel文件不匹配。

url <- "https://www.k-state.edu/pa/faculty/demographics/total/t2016.xlsx"

download.file(url, destfile = "t2016.xlsx",  mode = "wb")

library(readxl)

kansas_state <- read_xlsx("t2016.xlsx", skip = 165, col_names = FALSE)

gender <- kansas_state[1:4]
names(gender) <- c("COLLEGE", "N", "Male", "F")
gender

我正在阅读 Excel 表格中的最后一张表格，其中包含每个学院的总数。

然后，如果您打开 excel 文件并查看最后一个表格“大学总数”，有些数字不匹配。比如农学院，但是建筑学院……？

我还在这里分享了这个例子的 rstudio 项目的 github 公共链接：

https://github.com/AdamUArk/r_readxl_example

【问题讨论】：

标签： r excel xlsx readxl

【解决方案1】：

此文件中有隐藏的工作表，因此read_xlsx() 从其中一张工作表中读取，而不是您通常看到的工作表。要阅读您想要的内容，请将sheet = 'Totals' 添加到read_xlsx() 的参数中。

【讨论】：