【问题标题】:What is easier? Merge or Indicator variables?什么更容易?合并变量还是指示变量?
【发布时间】:2011-07-27 12:28:45
【问题描述】:


我有两组数据要调查。第一个是给定不同“细胞状态”的基因/基因组相关数据。第二组数据是将基因与生物途径相关联。我相信我的问题是一个关系数据库问题。

'我如何显示与一个数据框相关的数据并将其与另一个数据框相关联。换句话说,我想绘制细胞状态数据并将其与通路及其特定基因相关联。 (我认为是图片,所以这里是。)
dataframe1-来自 affymetrix 基因芯片的数据
基因、细胞状态 1、细胞状态 2...
基因1, x1, y1,...
基因2, x2, y2,...
gene.x, ... ...

"1" "gene" "log_b" "log_b_rich" "Fc_cdt_rich_tot" "fc_Etoh_CDT_tot_mono" "fc_Etoh_CDT_tot_poly" "fc_Etoh_CDT_mono_poly" "fc_Etoh_Rich_tot_mono" “fc_Etoh_Rich_tot_poly” “fc_Etoh_Rich_mono_poly” 的 “2” “PHF13”强> -2.712616698 -1.47923545 -0.791138043 -0.549610558 0.143808182 0.69341874 0.320812876 1.089260116 0.76844724结果的 “3”强> “SPSB1” -1.808348454 -1.965601198 -1.349135752 -0.780105329 0.410647447 1.190752776 0.587287796 1.260350195 0.673062399

dataframe2-来自 kegg db 的数据
通路1,基因-x1,基因-x2,...
通路2,基因-y1,基因-y2,...
通路3,基因-z1,...

"1" "KEGG_GLYCOLYSIS_GLUCONEOGENESIS" "PHF13" "LDHB" "LDHA" "PGAM1" "ADH1C" “PGAM2” “ADH1B” “ADH1A” “ACSS2” “PDHB” “ACSS1” “PGAM4” “PDHA2” “PDHA1” “LDHAL6B” “PFKL” “LDHAL6A” “FBP1” “PFKP” “ALDH3B2” “FBP2” “PFKM ""ALDH3B1""PGM2""G6PC""ALDH7A1""ALDH1B1""PKM2""PGM1""DLD""PKLR""ALDH9A1""ALDOA""ALDOC""ALDOB""ADH5""HK2""HK1"" ADH6” “ADH7” “ALDH3A2” “G6PC2” “ALDH3A1” “GALM” “TPI1” “AKR1A1” “ADH4” “HK3” “ALDH1A3” “ENO2” “ENO3” “GAPDH” “ENO1” “BPGM” “DLAT” “PCK2”“PCK1”“GPI”“GCK”“ALDH2”“PGK1”“PGK2”
“2”“KEGG_CITRATE_CYCLE_TCA_CYCLE”“PHF13”“OGDHL” “OGDH”“PDHB”“IDH3G”“LOC283398”“IDH2”“IDH1”“PDHA2”“PDHA1”“SUCLA2”“FH”“DLST”“ACO2”“SUCLG2”“ACO1”

“PHF13” 突出显示以显示每个步骤的相关性。

我想做的是,看看'cell-state1'(in-)是否激活了来自'cell-state2'的不同基因/途径。此外,我想测试特定通路的细胞状态 1 Vs 2 之间的相关性 (t 检验和可能的图形)

我的问题是,哪些命令或方法可以让我最容易/最有效地做到这一点:merge 还是使用 dummy variable

HTH

【问题讨论】:

  • 请重新表述您的问题,使其实际上成为一个编程问题,并且问题本身很清楚(包括您的数据结构)。什么是gene-x1,...什么是细胞状态,...?给出一个示例数据集,这样我们实际上就有了线索。另见stackoverflow.com/questions/5963269/…

标签: r merge indicator


【解决方案1】:

我想做的是,看看'cell-state1'(in-)是否激活了来自'cell-state2'的不同基因通路。

这听起来像是您需要进行因子分析。你可以问问statistics.stackexchange.com的好心人。

【讨论】:

  • 我认为我的问题不一定是统计数据,而是关系数据库问题。也许我的问题可能是,'我如何显示与一个数据帧相关的数据并将其与另一个数据帧相关联。我想绘制细胞状态数据并将其与基因和通路相关联。
猜你喜欢
  • 2011-02-06
  • 1970-01-01
  • 2011-03-03
  • 2013-03-16
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2023-03-10
  • 1970-01-01
相关资源
最近更新 更多