【问题标题】:How to find string in file contents如何在文件内容中查找字符串
【发布时间】:2022-01-27 23:28:33
【问题描述】:

我正在尝试在上传到 SharePoint 的文件中搜索字符串。

我正在使用向 SharePoint 发送 HTTP 请求来获取文件内容。但是 $content 在 Base64 中作为对象返回。如何在返回的 $content 中搜索字符串?

/_api/web/getfilebyserverrelativeurl('/sites/mySite/Shared%20Documents/myFileInWordOrPDFformat.docx')/$value?binaryStringResponseBody=true
    
    headers: 
    {
      "accept": "application/json;odata=nometadata",
      "content-type": "application/json;odata=nometadata",
      "odata-version": ""                     
    }

返回

{
  "$content-type": "application/octet-stream",
  "$content": "UEsDBBQAAAAIANZualN4vZl3IWQAAO2wAQARABwAd29-BlahBlahBlah-QQAAPCJAAAAAA=="
}

类似的帖子- https://sharepoint.stackexchange.com/questions/273774/how-to-get-content-of-file-in-sharepoint-using-sharepoint-rest-api https://debajmecrm.com/binary-to-base64-in-microsoft-power-automate-microsoft-flow/ https://linnzawwin.blogspot.com/2021/02/handle-base64-and-binary-file-content.html

有帮助,但我仍然不清楚。

我需要将我正在搜索的字符串转换为 Base64 并以这种方式搜索吗?

有什么建议吗?另外,我没有使用高级连接器的选项。

TIA!

【问题讨论】:

    标签: sharepoint-online power-automate


    【解决方案1】:

    这可能不适合您,但我会使用 Cloudmersive 文档转换操作来提取文本。这是一个高级连接器,因此除非您的用户启用,否则它将成为一个阻止程序。

    这是我发现的最好的方法,如果您不需要每月调用超过 800 次且每秒不超过一次,它仍然是免费的。

    如果您的要求超出此要求,则必须查看付费订阅。

    我研究了在 Azure 功能中使用 SyncFusion PDF 功能的方法,该功能可以与 Adob​​e 服务配对以将 DOCX 文件转换为 PDF,但对于 Stackoverflow 中的答案来说,它开始变得有点费力。 Adobe 的任务很简单,只是阅读 PDF 有点过分了。

    虽然它仍然是一个选项...https://www.syncfusion.com/kb/7178/how-to-use-pdf-control-in-nodejs-environment

    这是一个允许您搜索文本的示例,您只需要使用之前的链接和这些说明进行调整。仅供参考,使用 Node 的原因是因为 C# Azure Functions 仅支持 V1 运行时中的 .NET Framework,这已经非常过时了……https://docs.microsoft.com/en-us/azure/azure-functions/functions-versions……而 .NET Framework 是相关 Syncfusion 功能所必需的。我很高兴被社区中的其他人证明是错误的,但我可能是错的。

    这就是 Cloudmersive 连接器将为您做的事情......

    示例文档

    流程

    结果

    注意:我注意到的一件事是“Microsoft”这个词出现了错误。这有点奇怪,但你总是可以用 Cloudmersive 来解决这个问题。

    【讨论】:

    • 同意从 .docx 文件中提取 xml,但我也需要能够处理 pdf。
    • 如果你想要一个更完整的解决方案,那么你应该看看 Azure Search 之类的东西。请注意,SharePoint 具有各种搜索/索引功能,不妨研究一下。
    猜你喜欢
    • 2012-12-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-08-08
    相关资源
    最近更新 更多