【发布时间】:2017-05-27 14:58:57
【问题描述】:
我正在使用cloudera navigator、atlas 和Wherehows 等解决方案
获取 Hadoop、HDFS、HIVE、SQOOP、MAPREDUCE 元数据和沿袭。
现在我们在 AWS redshift 中也有一个数据仓库。有没有办法从红移中提取元数据或血统或两者信息。
到目前为止,我还没有找到任何关于此的内容。
有没有办法将其与爬网解决方案集成到 wherehows 中?
我只找到了一个post,它提供了一些关于如何从redshift 获取一些信息的信息,假设它类似于postgresql。我相信有人会为这个问题编写一些开源解决方案。 还是只需要编写一个简单的脚本来提取这些信息? 我正在寻找企业级解决方案。我希望有人能指出我正确的方向。
【问题讨论】:
-
Amazon Redshift 只是一个数据库——它不包含有关数据沿袭的任何信息。您可以提取已运行的查询列表,然后据此进行推断,但这并不明显也不明确。
-
您可以从 information_schema 视图中提取元数据信息。虽然没有血统,afaik。
标签: amazon-web-services amazon-redshift hadoop2 database-metadata data-lineage