【发布时间】:2021-05-18 20:08:32
【问题描述】:
我有一个来自eqtl 分析的输出文件和MatrixEQTL:
SNP gene beta t-stat p-value FDR
ch01_76563780 GW_06g072920 0.049942008791647 932.306067766817 2.2250738585072e-308 1.60416093688267e-302
ch02_36905357 GW_06g072920 -0.049942008791647 -932.306067766817 2.2250738585072e-308 1.60416093688267e-302
ch07_69573723 GW_06g072920 0.049942008791647 932.306067766817 2.2250738585072e-308 1.60416093688267e-302
ch01_87880392 GW_06g072920 0.0499413219745195 923.819795644165 2.2250738585072e-308 1.60416093688267e-302
我正在尝试计算每个基因的关联,以获得重要的基因进行总结。我将不胜感激任何建议。谢谢!
【问题讨论】:
-
嗨,用户 1567654,您如何定义关联?如果有要遵循的公式,则对按“基因”分组的数据执行该操作。例如数据 %>% dplyr::group_by(gene) %>% dplyr::summarize(result = your_association_formula)。祝你好运。
-
嗨@Jagge,谢谢!每一行在这里代表一个关联。我想查看每个基因的输出中有多少 SNP(第 1 列)。例如,基因 GW_06g072920 有 4 个与原始问题相关的 SNP。
标签: r