【发布时间】:2021-05-13 15:24:20
【问题描述】:
我正在使用 kedro.extras.datasets.pandas.SQLTableDataSet 并希望使用 pandas 的 chunk_size 参数。但是,在运行管道时,表会被视为生成器,而不是 pd.dataframe()。
您将如何在管道中使用 chunk_size?
我的目录:
table_name:
type: pandas.SQLTableDataSet
credentials: redshift
table_name : rs_table_name
layer: output
save_args:
if_exists: append
schema: schema.name
chunk_size: 1000
【问题讨论】:
标签: kedro