【发布时间】:2017-04-29 07:43:42
【问题描述】:
我们目前正在尝试使用 Sqoop 将数据从 Hadoop 摄取到 Azure SQL 数据仓库,但出现与事务隔离级别相关的错误。发生的情况是 Sqoop 在尝试导入/导出时尝试将事务隔离级别设置为 READ COMMITTED,而 Azure SQL 数据仓库目前不支持此功能。我尝试使用 Sqoop 的 --relaxed-isolation 参数,但仍然没有效果。 作为解决方案,我正在考虑: 1. 更改 Sqoop 源代码以将 Sqoop 的行为更改为不设置事务级别 2. 寻找可能允许我以编程方式更改此 Sqoop 行为的 API(如果有)。
有人遇到过这种情况吗?寻找对提议的解决方案的建议以及如何实施这些建议。
【问题讨论】:
-
我无法帮助您使用 Sqoop,但您是否考虑过使用 Polybase 将数据从 Hadoop 移动到 Azure SQL 数据仓库 (ADW)?这是它的主要用例之一,也是 Microsoft 对 ADW 的高性能数据加载的建议。
-
我们认为 Polybase 是一种潜在的选择,但由于某些安全问题,我们没有得到安全团队的认可在我们的环境中使用它。
标签: hadoop transactions sqoop azure-sqldw