【发布时间】:2018-01-17 09:23:23
【问题描述】:
我尝试从 pdf 文件中读取表格并将其转换为数据框,但它正在将单元格中的下一行视为单独的行,如下所示
正如您在上图中看到的,它将每一行视为一行,我想合并每一行,直到第一列中存在一个值。这样我的数据框看起来像。这个
我们有什么办法可以做到这一点。
这是样本数据
structure(list(V1 = c(1L, NA, NA, 2L, NA, NA), V2 = c("Chawla Associates",
"Architects, Interior", "Designers", "J Square", "Designers &",
"Engineering"), V3 = c("B-102, Sanik Nagar,", "Uttam Nagar, New",
"Delhi-110059", "H-office: H No.1031,", "Sec-67, Mohali (PB)",
"431-432, Sec-8,"), V4 = c("253336493", "M-", "9.51242E+11",
"M-9872815438", "M-98722-22676", NA), V5 = c("-", NA, NA, "Telefax-",
"0172-", "2574602"), V6 = c("Abhi2874@yahoo.co.in", NA, NA, "vincaljaidka@hotmail.co",
"m", NA), V7 = c("CA/99/24551", NA, NA, "CA/96/20742", NA, NA
)), .Names = c("V1", "V2", "V3", "V4", "V5", "V6", "V7"), row.names = c(NA,
-6L), class = c("tbl_df", "tbl", "data.frame"))
谢谢
多尼克
【问题讨论】:
-
不要将数据作为图片发布,使用
dput(data),或者如果是大data.frame,使用dput(head(data, 20))。 在问题中发布这些命令的输出。 -
@RuiBarradas 使用示例数据编辑了帖子。