【发布时间】:2020-08-24 20:03:10
【问题描述】:
我有一个带有一堆超链接的 html 大文本文件,例如:
"Hello I want to talk about <a href="www.google.com">Google</a> and <a href="www.facebook.com">Facebook</a>."
我正在寻找一种从 txt 文件中提取所有这些内容的方法,这样我就有了一个包含以下列表的大 Google 表格:
- www.google.com — 谷歌
- www.facebook.com — Facebook
等等……
但是,我的编码知识基本上为零,所以我正在寻找一个关于如何做到这一点的非常简单的解释(例如,如果你认为我应该使用 Python 脚本,我需要知道如何做到这一点,要做什么下载等)。
非常感谢您提供有用的答案!
【问题讨论】:
-
这个问题对于 Stack Overflow 来说太宽泛了。问题确实需要具体和技术性。我建议阅读有关正则表达式的内容。网上有例子可以匹配超链接
-
互联网上哪里是我提出这些广泛问题的好地方?
-
有很多好的编程论坛,r/learnprogramming 是个好地方。
标签: html google-sheets