【发布时间】:2023-02-09 18:33:13
【问题描述】:
我有一些包含以下列的数据集:order_code、city、weight 如何只在数据集中保留有重量的包裹5个百分点<X<95%对于每个城市(类似于 SQL 中的窗口函数(按城市划分))?
df = pd.DataFrame({
'city': ['LA', 'Berlin', 'Hamburg', 'LA', 'Berlin', 'Hamburg', 'Tokyo', 'Hamburg', 'Berlin', 'Hamburg', 'Hamburg', 'Hamburg', 'Berlin', 'Hamburg', 'Berlin', 'Tokyo', 'Tokyo', 'Tokyo'],
'weight': [930,933,1577,1018,547,981,1672,598,995,1164,601,1429,1349,1000,618,539,880,1472]
})
【问题讨论】:
-
发布可测试的数据框