【问题标题】:when to use multiple azure synapse workspaces?何时使用多个 azure synapse 工作区?
【发布时间】:2021-09-27 23:56:08
【问题描述】:

我有一个 azure synapse 工作区,其中包含无服务器 sql 池中的许多管道和外部表。都与一个特定的项目相关联。

还有另外 2-3 个完全独立的项目需要突触工具集。

我应该创建一个新的工作区,还是让他们都共享这个? 用于决定的最佳标准是什么?

【问题讨论】:

  • 这完全是一个商业决策,所以我怀疑是否有任何真正的指导。最好的描述可能是安全性。如果单独的项目有不同的用户、访问控制、存储帐户等,这可能是一个很好的决定方式。

标签: azure-synapse


【解决方案1】:

这可能是一个意见问题,它在 StackOverflow 上的表现并不好,但也就是说,我倾向于认为 Synapse Workspaces 类似于 SQL Server 的实例,所以从历史上看,你为什么要是否使用过相同的 SQL 实例?

通常这是项目有共同点的地方,例如相同的数据、相似的权限 (AAD) 组、相似的 HADR 要求等,所以问问自己这些问题。

请记住,您可以在一个工作区中拥有多个数据库(专用和无服务器),但只能通过 Spark Pools1 对专用 sql 池中的表进行跨数据库查询。如果您需要分离,这可能对您有利。另请记住,您可以将多个存储帐户连接到工作区。拥有多个工作区没有成本开销,但存在管理开销,并且跨多个湖、存储帐户和数据库复制任何数据会产生成本影响。

一个示例 - 我们将工作区用于没有单独的开发、测试和 uat Azure 订阅的环境。

所以有几点需要考虑。


1 将这两个表作为数据框导入,然后按照this example 将它们连接到 Synapse 笔记本中

【讨论】:

  • 一如既往,可靠的答案@wBob。我要补充一点,跨数据库查询(基本上)可以通过笔记本实现,但这是唯一可以真正跨越这些边界的环境。外部表和 Spark 表可以在一定程度上将其中一些功能扩展到 T-SQL。
  • lol @JoelCochran 我知道,我们也经历过同样的痛苦,我的意思是我可以添加一个注释,例如扩展 this one,但对于这个答案来说,这有点像我思考。我知道很多人对这些意见不屑一顾,最终可能会被关闭,但有人在寻求帮助,一些意见,所以我会投入我的两分钱。也许值得扩展可能真正有用的标准列表 - 我们将工作区用于环境,例如没有单独的开发、测试、uat Azure 订阅。
  • 很好的答案@wBob,感谢您理性的回复。
猜你喜欢
  • 2021-12-22
  • 2022-01-19
  • 2021-08-15
  • 2020-09-25
  • 1970-01-01
  • 2020-07-29
  • 2020-10-19
  • 2021-11-03
  • 2022-01-07
相关资源
最近更新 更多