【发布时间】:2021-07-30 22:43:35
【问题描述】:
我有以下使用熊猫数据框的代码。但是,当我将 Pandas 数据框转换为 Koalas 并运行以下代码时,出现错误“函数示例当前不支持指定要返回的确切项目数。请改用 frac”
df.loc[df.sample(int(len(df) * .05)).index, 'distance'] = None
我尝试使用下面的代码给我随机记录。但是它如何获取数据框中的所有记录并用空值替换 5 % 记录的距离
df.sample(frac=0.05, random_state=1)
【问题讨论】:
标签: python pandas apache-spark pyspark spark-koalas