【发布时间】:2015-07-27 05:46:10
【问题描述】:
我有一个跨国数据集,其中每个受访者至少有一本日记。每个受访者的日记数量和日记完成日因国家/地区而异。
例如,在一个国家/地区,每位受访者仅完成 1 篇日记(一半受访者仅在周末完成,而另一半仅在工作日完成)。在另一个国家,每个受访者完成了 2 篇日记(一个周末 - 一个工作日),而在另一个国家,每个人都完成了 7 篇日记(一周中的每一天)。还有一些调查显示,一些受访者返回了 2 篇日记,而另一些则返回了 3 篇;有些人每个人都退回了4本日记。数据如下所示:
country_id<-rep(1:4,c(8,8,14,10))
diarist_id<-c(11:18,rep(21:24,each=2),
rep(31:32,each=7),
rep(41:44,c(3,3,2,2)))
diary_id<-c(111:118,211,212,221,222,231,232,241,242,
311:317,321:327,411,412,413,
421,422,423,431,432,441,442)
weekend<-c(1,0,1,0,1,0,1,0,1,0,1,0,1,0,1,
0,1,1,0,0,0,0,0,1,1,0,0,0,0,0,1,
0,1,0,1,0,1,0,1,0)
dat<-data.frame(country_id,diarist_id,diary_id,weekend)
我正在尝试从每个国家/地区抽取“一人一日记”的随机样本。但在国家层面,我需要 - 大约 - 29% 的日记是周末日记。如何按组抽取这样的条件随机样本?
【问题讨论】:
-
您是否考虑过在
sample中使用prob选项? -
@MichaelChirico 我不知道如何在“样本”中整合条件
标签: r random-sample