【问题标题】:webcontent save in csv format网页内容以 csv 格式保存
【发布时间】:2011-04-06 03:18:54
【问题描述】:

我想从网站上读取内容,然后保存到 php 中的 csv 文件中,谁能告诉我该怎么做。

【问题讨论】:

  • 你想如何拆分网站的源?
  • 网站是 HTML 格式。 CSV 代表“逗号分隔值”。您想如何将 HTML 转换为 CSV?
  • 我只想保存内容。
  • “内容”到底是什么?

标签: php url web csv


【解决方案1】:

您希望如何将网站内容保存为 csv 文件? CSV 表示逗号分隔值,将内容保存为 csv 文件而不是网站内容真的很容易吗?

您说“来自网站的内容” - 通常您会开始阅读一个网站的内容,其中包括 html 标记、脚本和样式。还是只想获取文本内容或一些元数据?

如果您的服务器支持通过fopen 打开网址,我会尝试这个(php.ini 选项:allow_url_fopen) - 否则您将不得不使用cURL 或其他东西。

Here 的更多关于用 php 阅读网站的信息。 关于将网站存储为 csv 我认为您应该更精确地实现您想要实现的目标。

问候,丹尼尔

【讨论】:

  • 我只想要网站内容。网站有一些表格等,所以我想将表格数据放入 csv 文件中。
  • @Manoj 从未定义的表结构中抓取数据是一个非常复杂的问题。没有通用的解决方案
  • cricinfo.com/rankings/content/page/211271.html这个网站有2个表格我想把表格数据保存到一个csv文件中。
  • 嗯,你应该先获取我上面帖子中描述的网站内容。然后你必须用某种正则表达式解析 html 标记(你会在互联网上找到几十个例子 - 看看 [this][1] )。 [1]:blog.mspace.fm/2009/10/14/parse-an-html-table-with-php
【解决方案2】:

您的问题没有即时神奇的答案。我们(您)需要知道哪个网站有问题,表格是如何呈现的。如果你对你的场景了如指掌,你应该使用 PHP 的 DOM 函数并解析你的表格,然后将其导出为 CSV。

【讨论】:

    猜你喜欢
    • 2010-11-16
    • 1970-01-01
    • 2023-04-07
    • 2012-03-02
    • 2015-07-18
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-05-11
    相关资源
    最近更新 更多