【发布时间】:2021-10-01 10:21:11
【问题描述】:
我想知道如何在 value_count() 等于某个值的数据框中选择第一个观察值。
我尝试了以下方法:
trip_id_value_count = trip_df["trip_id"].value_counts()
trip1 = trip_df[(trip_id_value_count == 378)]
但是,我得到了错误:
IndexingError:作为索引器提供的不可对齐布尔系列(布尔系列的索引与索引对象的索引不匹配)。
由于值计数可以重复,我想保留它的第一次出现。我的最终目标是提取观察量不同的不同行程。例如,这次旅行 1 将有 378 个观察值。其他人可能有 121、50 等等...
我期望的输出是一个数据框,其中包含该trip_id 的所有具有所选值计数的行。例如,如果trip_id 626xy83m 的值计数为378,并且它是数据帧中显示的第一个具有该值计数的trip_id,我想将其提取为数据帧并将其存储在trip1中。
【问题讨论】:
-
如果您在预期结果中包含示例数据框将会很有帮助。
-
我编辑了问题
标签: python pandas dataframe indexing count