【发布时间】:2015-08-28 19:08:57
【问题描述】:
我有以下长格式的数据框:
> head(cleanLongPlotData)
Structure Method Value Outcome
1 1A00 X1 1 Clustering
2 1A01 X1 1 Clustering
3 1A02 X1 0 No Clustering
4 1A0U X1 1 Clustering
5 1A0Z X1 1 Clustering
6 1A1M X1 0 No Clustering
> tail(cleanLongPlotData)
Structure Method Value Outcome
12931 4PRN Z 0 No Clustering
12932 4PRP Z 0 No Clustering
12933 4PXZ Z -1 Blank
12934 4PY0 Z -1 Blank
12935 4Q3H Z -1 Blank
12936 6HBW Z 1 Clustering
每种方法都有 2,196 个观察值。我是这样绘制的:
p1 <- ggplot(cleanLongPlotData, aes(x=Method, y=Structure,fill=Outcome)) + geom_tile()+
xlab("Method") +
ylab("Structure")+
ggtitle("Cluster Results By Structure")+
theme(axis.line=element_blank(),
axis.text.y=element_blank(),axis.ticks=element_blank(),
panel.background=element_blank(),panel.border=element_blank(),
panel.grid.major=element_blank(),
panel.grid.minor=element_blank(),plot.background=element_blank())+
scale_fill_manual(values = c("#F5F5F5","green","blue"))
我已经屏蔽了这些行,因为它们相互重叠并弄得一团糟。有没有办法显示每 100 行名称?还是每 200 行名称?
【问题讨论】:
-
rownames(cleanLongPlotData)[seq(1,nrow(cleanLongPlotData),by=100L)]等 -
@MichaelChirico:我得到的那部分,我更好奇我需要把它保存在哪里才能让它工作?
-
y 轴是一个因素。您是说要在 y 轴上标识每 100 个因子水平吗?这有意义吗?
-
@jlhoward:是的,y 轴只是特定蛋白质结构的一行。通过识别每 100 个结构,这将有助于强化 1)这些只是蛋白质结构,没有固有的排序;2)这些结构按照我的文本中描述的字典顺序排列。