【发布时间】:2016-12-23 01:51:45
【问题描述】:
我正在向网页发出请求,并试图检索其中的一些文本。文本用 span 标签拆分,如下所示:
<span class="ed">This</span>
<span class="1">is</span>
<span class="12">jvgviehrgjfne</span>
<span class="dfe">my</span>
<span class="fd">gt4ugirdfgr</span>
<span class="df">string</span>
有“内联样式表”(CSS 表)表示我们是否必须将文本打印到屏幕上,因此,不要在屏幕上打印乱码。这是工作表 1 的示例:
.ed{display:inline}
.1{display:inline}
.12{display:none}
.dfe{display:inline}
.fd{display:none}
.df{display:inline}
但是有更多这样的CSS文件..所以我不知道是否有更好的方法来实现我的目标(打印屏幕上显示的文本而不使用未显示的乱码)
我的脚本能够打印文本.. 但所有内容(带有乱码)如下:“这是 jvgviehrgjfne 我的 gt4ugirdfgr 脚本!”
【问题讨论】:
-
你也可以发布你尝试过的python脚本吗?
-
css 文件没有意义。
标签: python css beautifulsoup python-requests