【问题标题】:How to grep gene list from excel file having multiple sheets如何从具有多张工作表的excel文件中grep基因列表
【发布时间】:2016-08-04 15:52:47
【问题描述】:

我有一个包含 5 张工作表的 Excel 文件(命名为 sample_set1、sample_set2、sample_set3、sample_set4 sample_set5),所有工作表都有相同的列标识符,其中第一列是geneID,总共 10 列,我还有另一个 txt 文件,其中包含15个基因。我想从 5 张 excel 文件中提取所有这 15 个基因,怎么做。

excel文件示例:(这里我展示的是sheet1,sample_set1)

geneID  TargetID        logFC   AveExpr t       P.Value adj.P.Val       B
PPY     NA      3.851289867     8.286098382     9.248930908     1.65E-07        5.58E-05        7.719759837
ADAM19  NA      3.63303542      6.429227788     12.7709784      2.37E-09        4.22E-06        11.7022157
C1orf168        NA      3.356129623     8.179616947     2.452446501     0.027210207     0.119946233     -4.088177703
PCLO    NA      3.343134222     7.362014909     7.397273        2.53E-06        0.000346369     5.050920805
ITK     NA      3.247982793     6.949399635     10.14382461     5.04E-08        2.55E-05        8.854596984
KRT81   NA      3.106404516     7.139258174     6.07286468      2.34E-05        0.001615256     2.846868821
CYFIP2  NA      3.028907855     8.153794727     8.448486413     5.10E-07        0.000118421     6.622009208
C6orf114        NA      3.000587733     7.073926544     9.226456201     1.70E-07        5.61E-05        7.690036227
GAGE2A  NA      2.904535471     12.69703007     5.180909306     0.000119578     0.00439474      1.220825054
MAGEC2  NA      2.884169434     5.93712535      12.1389375      4.70E-09        5.91E-06        11.07632071

txt 文件是:

geneID
PPY
ADAM19
C1orf168
PCLO
ITK
KRT81
CYFIP2
C6orf114

【问题讨论】:

标签: r


【解决方案1】:

这是未经测试的.....

# This is a useful package
library(readxl)

# Define your file
file <- "myexcelfile.xlsx"

 # Get a list of sheets
sn <- excel_sheets(file)

# Read a sheet from each file
dat <- lapply(sn, read_excel, file = file)

# Get the first column from each set
gn <- lapply(dat, `[[`, 1)

# Combine each components
do.call(c, gn)

【讨论】:

  • 谢谢,但我想要所有对应的列,而不仅仅是第一列
  • 我得到了这个错误:当使用 dat
猜你喜欢
  • 2015-10-17
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-07-30
相关资源
最近更新 更多