【问题标题】:Difference between BigQuery and Jupyter NotebookBigQuery 和 Jupyter Notebook 之间的区别
【发布时间】:2018-12-17 23:03:39
【问题描述】:

我是 StackOverflow 的新手,我到处研究了为什么选择 Google BigQueryJupyter Notebooks 来为机器学习项目创建新变量和准备数据。到目前为止,我在使用 Jupyter Notebooks 进行数据科学项目方面拥有丰富的经验(喜欢 python!),但现在我们在办公室使用 GCP,没有人能够回答为什么(或何时)选择一个更好。另一个。

Datalab 在 Jupyter Notebooks 上做得很好,我们现在拥有的数据一部分存储在 GCS 中,一部分存储在 Cloud SQL 中(我只从那里检索数据并开始使用变量)。

非常感谢!

【问题讨论】:

    标签: python google-bigquery jupyter-notebook


    【解决方案1】:

    BigQuery 是一个数据湖,一个大型数据库。对于您的问题,需要使用 Cloud SQL/GCS 等数据源。您需要在 BQ 中存储行并在您的工具中使用来编写图表/算法。

    BigQuery 无法与 Jupyter Notebook 相提并论,因为它只是两种不同的产品。

    【讨论】:

    • 感谢您的回答!也许我没有清楚地解释自己。我一直在使用 BigQuery 来聚合不同的表并获取一个数据框来训练机器学习模型。另一方面,我使用 jupyter notebook 在我的个人电脑上做同样的事情。我不知道什么时候选择一个比另一个更好。我认为数据大小是一个问题,但不太确定。
    • BigQuery 是一个数据湖,因此它可以处理数十亿行,如果您的数据大小适合您的笔记本而不是在那里处理,如果不适合 BQ。我会假设任何超过 1000 行的内容都应该进入数据库。
    • 一般来说,最好在 w 数据库中预先聚合您的数据,而不是在 Jupyter 笔记本中进行此处理,但正如 @Pentium10 所说,这取决于您正在处理的数据的大小。跨度>
    • @MariaOliviaLihn 请注意,您可以从 Jupyter 笔记本访问 BigQuery。您从 BigQuery 获取数据并在(本地)Jupyter 脚本中使用它。例如,请参阅下面的链接。此外,您可以在 Google Cloud 服务中的虚拟机上运行 Jupyter notebook。 towardsdatascience.com/…
    猜你喜欢
    • 2019-06-06
    • 2021-08-20
    • 1970-01-01
    • 2018-12-01
    • 1970-01-01
    • 1970-01-01
    • 2021-04-09
    • 1970-01-01
    • 2020-09-11
    相关资源
    最近更新 更多