【问题标题】:How to migrate data from teradata to GCS using Apache Beam如何使用 Apache Beam 将数据从 teradata 迁移到 GCS
【发布时间】:2022-01-18 06:06:37
【问题描述】:

我们可以使用哪些 jar 文件?我们将如何从 Apache Beam 连接到 Teradata 并读取表?

【问题讨论】:

    标签: google-cloud-platform google-cloud-storage teradata apache-beam


    【解决方案1】:

    对于 Java SDK,您可以使用JdbcIO 连接器从 Teradata 读取数据,并使用FileIO 将其写入 GCS。

    【讨论】:

    • 我是在 python 中使用 JdbcIo 完成的。但是我现在得到了 jdbc driver_class_name "com.teradata.jdbc.TeraDriver" 的 classnotfound 异常。
    • Python jdbcio 是一个多语言连接器(在下面使用 Java JDBCIO),因此您必须使用正确的 jar 启动扩展服务。这里有更多信息:beam.apache.org/documentation/sdks/…
    • @chamikara 感谢您的回复。我想使用默认扩展服务,如 :beam.apache.org/releases/pydoc/2.35.0/apache_beam.io.jdbc.html 中给出的,我安装了 Java Runtime 并确保 java 命令可用。但是在那之后,当我使用 beam.Pipeline() as p 运行下面的代码时: result = ( p | 'Read from jdbc' >> ReadFromJdbc( table_name='staff', driver_class_name='com.mysql.jdbc.Driver' , jdbc_url='jdbc:mysql://localhost:3306/example', username='root', password='root', )) 我得到了 ClassNotFound 异常。
    猜你喜欢
    • 1970-01-01
    • 2018-02-13
    • 2020-06-28
    • 1970-01-01
    • 2021-08-03
    • 1970-01-01
    • 1970-01-01
    • 2019-03-08
    • 2022-10-13
    相关资源
    最近更新 更多