【问题标题】:Dask .loc only the first result (iloc[0])Dask .loc 只有第一个结果(iloc[0])
【发布时间】:2020-11-25 16:00:18
【问题描述】:

示例 dask 数据帧:

import pandas as pd
import dask
import dask.dataframe as dd

df = pd.DataFrame({'col_1': [1,2,3,4,5,6,7], 'col_2': list('abcdefg')}, 
                  index=pd.Index([0,0,1,2,3,4,5]))
df = dd.from_pandas(df, npartitions=2)

现在我只想返回第一个(基于索引)结果 - 就像在 pandas 中一样:

df.loc[df.col_1 >3].iloc[0]
   col_1 col_2
2      4     d

I know there is no positional row indexing in dask using iloc,但我想知道是否可以像在 SQL 中那样将查询限制为 1 个结果

【问题讨论】:

    标签: pandas dask dask-dataframe


    【解决方案1】:

    知道了 - 但不确定这里的效率:

    tmp = df.loc[df.col_1 >3] 
    tmp.loc[tmp.index == tmp.index.min().compute()].compute() 
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2017-09-09
      • 2015-10-14
      • 1970-01-01
      • 2018-02-08
      • 2021-12-06
      相关资源
      最近更新 更多