【发布时间】:2015-09-04 12:31:52
【问题描述】:
df1 <- read.table(text="
gene_id A1 A2 A3 A4 length Total
ENSMUSG00000000028 58 93 48 58 789 200
ENSMUSG00000000031 11 7 20 16 364 54
ENSMUSG00000000037 3 5 6 98 196 112
ENSMUSG00000000058 66 93 69 71 436 299
ENSMUSG00000000085 55 68 97 67 177 287", header=TRUE)
该表表示不同样本(A1、A2..A4)中基因的读取计数。 如何使用 R
计算这些原始读取计数的每百万映射读取 (RPKM) 的读取RPKM = (一个基因的读取数 * 1e6)/(总*长度)
out_put <- read.table(text="
gene_id A1 A2 A3 A4
ENSMUSG00000000028 367.5539 589.3536 304.1825 367.5539
ENSMUSG00000000031 559.6256 356.1254 1017.5010 814.0008
ENSMUSG00000000037 136.6618 227.7697 273.3236 4464.2857
ENSMUSG00000000058 506.2747 713.3871 529.2872 544.6289
ENSMUSG00000000085 1082.6985 1338.6090 1909.4864 1318.9236", header=TRUE)
【问题讨论】:
-
你已经尝试过什么?为什么它不起作用?
-
@heroka.. 我很困惑如何使用这个函数编写 r 脚本
-
你是什么功能?你能展示一些预期的输出吗?查看您提供的数据和公式,您唯一缺少的是基因中的读取数(我认为是 A1+A2+A3+A4?)。
-
@Heroka,请找到预期的输出文件。
-
这取决于你。查看 dplyr 和 reshape2。
标签: r bioconductor