【发布时间】:2020-10-28 09:12:04
【问题描述】:
我是网络抓取的新手,我尝试通过使用字符串作为定位内容的工具来解析文件中的特定内容。该字符串包含多个单词,并且在文件中,该字符串已被分成两行。
我写的代码再也找不到这个字符串了。我已经尝试过rstrip() 和replace() 函数,但它们都不起作用。示例如下。图片
是一个文本文件,我在其中突出显示了我尝试定位的字符串"PRINCIPAL STOCKHOLDER"。如图所示,字符串被分成两行,由于找不到字符串,代码返回none。
以下代码不起作用:
text_locate = 'PRINCIPAL STOCKHOLDER'
text = (str(text_locate).replace('\r', '').replace('\n', ''))
【问题讨论】:
-
试试
' '.join(test.split())- 这将删除所有多个空格和换行符并将它们缩小到1个空格。 -
抱歉代码是由 text = ' '.join(test.split()) 写的?
标签: python string parsing scrape