【发布时间】:2021-02-26 03:48:41
【问题描述】:
我有一个问题陈述如下:
在每个考试中心,考试分第一批和第二批两班倒组织(报到时间上午 9:00 和下午 2 点)。考试可以在 2020 年 12 月 1 日至 30 日期间在学区的任何一天进行,具体取决于学区的考生人数。请注意,每个学区只能有一个考试中心,一个班次最多可以出现 20 名学生。根据上述信息完成考试数据库的分配:
- Rollno:候选卷号将从NL2000001开始(例如:NL2000001、NL2000002、NL2000003……)
- cent_allot:通过输入考试城市代码分配中心
- cent_add:将 NL "District Name" 作为每个位置的中心地址(例如,如果地区名称是 ADI,则中心添加是 NL ADI)
- examDate:在 2020 年 12 月 1 日至 2020 年 12 月 30 日之间分配任何考试日期,保持最少考试天数且不违反上述任何条件
- 批次:分配批次 I 或 II,确保上述所有条件
- rep_time:第一批报告时间为上午 9 点,第二批报告时间为下午 2 点。
根据上面的描述,我需要制作一个满足上述条件的表格。我已经制作了 Rollno、cent_allot 和 cent_add 列,但我正在努力制作 examDate 列,因为对于每 40 个地区值,它应该具有相同的日期。
以下是地区列表及其出现频率:
Dist Count
WGL 299
MAHB 289
KUN 249
GUN 198
KARN 196
KRS 171
CTT 169
VIZ 150
PRA 145
NALG 130
MED 128
ADI 123
KPM 119
TRI 107
ANA 107
KHAM 85
NEL 85
VIZI 84
EGOD 84
SOA 84
SIR 80
NIZA 73
PUD 70
KRK 69
WGOD 56
这是数据框的前 25 行:
Rollno cent_allot cent_add examDate batch rep_time
NL2000001 WGL NL WGL NaN NaN NaN
NL2000002 WGL NL WGL NaN NaN NaN
NL2000003 WGL NL WGL NaN NaN NaN
NL2000004 KUN NL KUN NaN NaN NaN
NL2000005 KUN NL KUN NaN NaN NaN
NL2000006 KUN NL KUN NaN NaN NaN
NL2000007 GUN NL GUN NaN NaN NaN
NL2000008 GUN NL GUN NaN NaN NaN
NL2000009 GUN NL GUN NaN NaN NaN
NL2000010 GUN NL GUN NaN NaN NaN
NL2000011 VIZ NL VIZ NaN NaN NaN
NL2000012 VIZ NL VIZ NaN NaN NaN
NL2000013 VIZ NL VIZ NaN NaN NaN
NL2000014 VIZ NL VIZ NaN NaN NaN
NL2000015 MAHB NL MAHB NaN NaN NaN
NL2000016 MAHB NL MAHB NaN NaN NaN
NL2000017 MAHB NL MAHB NaN NaN NaN
NL2000018 WGOD NL WGOD NaN NaN NaN
NL2000019 WGOD NL WGOD NaN NaN NaN
NL2000020 WGOD NL WGOD NaN NaN NaN
NL2000021 WGOD NL WGOD NaN NaN NaN
NL2000022 EGOD NL EGOD NaN NaN NaN
NL2000023 EGOD NL EGOD NaN NaN NaN
NL2000024 EGOD NL EGOD NaN NaN NaN
NL2000025 EGOD NL EGOD NaN NaN NaN
最后 3 列都是 NaN,因为这 3 列尚未生成。
我们以WGL 为例。根据上述说明,每个区每班最多允许20名候选人,这意味着同一日期将分配给每个区40次,同一批次和相同的报告时间需要分配给每个区20次区。
有人知道怎么做吗?
【问题讨论】:
标签: python pandas dataframe datetime data-science