【发布时间】:2017-04-28 17:21:17
【问题描述】:
在这方面有点 a.newb,但我有大约 15,000 个包含 XBRL 数据的 html 文件。 我已经从http://download.companieshouse.gov.uk/en_monthlyaccountsdata.html 下载了这些文件 理想情况下,我想从所有这些文件中提取与公司名称和无形资产相关的信息,但我不确定如何执行此操作。
理想情况下,我希望将数据导出到单个 Excel 文件的列中。
任何帮助将不胜感激。
【问题讨论】:
-
您需要某种形式的编程语言来解析 HTML 文件。我建议你查一下 Python 和 Beautiful Soup。
-
您也可以在 YAML 中实现这一点 - 值得一试,但正如 @RaduGheorghiu 所说,您将需要某种编程语言。
-
您将在哪个开发平台上完成这项工作?它是 .NET 工作的吗?
标签: xbrl