【发布时间】:2018-02-26 00:10:00
【问题描述】:
我必须分析来自经济实验的数据。 我的数据库由 14 976 个观测值和 212 个变量组成。在这个数据库中,我们还有其他信息,例如利润、总利润、治疗和其他变量。 你可以看到我有两种类型:
类型 1 适用于卖家
类型 2 适用于买家
对于某些变量,结果放在买家(类型 2)行中,而不是卖家行中(这是一个完全任意的选择)。但是,我想分析多收(例如)的卖家的性别。所以我需要操作我的数据库,但我不知道该怎么做。
这里,你有部分数据库:
ID Gender Period Matching group Group Type Overcharging ...
654 1 1 73 1 1 NA
654 1 2 73 1 1 NA
654 1 3 73 1 1 NA
654 1 4 73 1 1 NA
435 1 1 73 2 1 NA
435 1 2 73 2 1 NA
435 1 3 73 2 1 NA
435 1 4 73 2 1 NA
708 0 1 73 1 2 1
708 0 2 73 1 2 0
708 0 3 73 1 2 0
708 0 4 73 1 2 1
546 1 1 73 2 2 0
546 1 2 73 2 2 0
546 1 3 73 2 2 1
546 1 4 73 2 2 0
要做我想做的事,我有很多信息(在第 x 期、第 x 组、匹配第 x 组中,只有一位卖家与一位买家匹配,并且处理 x...)。 举个例子,在匹配组 73 中,我们知道在第 1 阶段,受试者 708 被多收费用(组 1 中的那个)。据我所知,这个人属于第 1 组和第 73 组,我能够识别出在第 1 期向他多收费用的卖家:主题 654,性别 =1。
因此,我想在卖家行(类型 ==1)上放置过度收费(和其他一些)买家价值,以分析卖家行为,但在正确的时期,对于正确的组和正确的匹配组。
【问题讨论】:
标签: r database dataframe replace dplyr