【发布时间】:2021-07-15 19:03:55
【问题描述】:
编辑:离答案还很遥远。感谢您的帮助...
我的公司有一些包含我需要的数据的简单列表,并且我们已经在数据湖中拥有这些 .parquet 格式的列表。 (编辑:第 2 代)
我应该构建一个使用这些列表中的一些信息的小型 PowerApp,但我无法找出通过 Flow 获取它们内容的正确方法。
有一个连接器“Azure Blob 存储:获取 Blob 内容”,听起来很正确,并且确实输出了一个神秘的内容字符串。但是我如何从这个到一个可以使用这些项目的实际可读的表?或者这是错误的连接器?
(对所有这些微软的东西都很新。对这个数据湖是如何设置的等一无所知。不确定这是否有帮助,但基本上下面的 Python 脚本可以工作,这正是我需要通过流,所以它可以每天自动完成:)
import os
from io import BytesIO
import pandas as pd
from azure.storage.blob import BlobServiceClient, BlobClient
from azure.storage.blob import ContentSettings, ContainerClient
blob = BlobClient.from_connection_string(MY_CONNECTION_STRING, "myContainer", "myFile.parquet")
df = pd.read_parquet(BytesIO(blob.download_blob().readall()))
感谢您的帮助:)
澄清一下:我绝对不必使用这个确切的过程。如果你告诉我“标准方法是在数据湖之上构建一个 python REST Api 来回答这个问题,那很好。我只需要知道访问数据湖中数据的最简单和最标准的方法)
【问题讨论】:
标签: azure power-automate power-platform