【发布时间】:2020-07-12 17:41:23
【问题描述】:
我有这些标签,这些标签是我从网络抓取工具返回的,作为我正在制作的 CLI 应用程序的一部分,我正在尝试查看标签中的子字符串是否包含我的单词列表中的一行。我试图手动将两个值都转换为字符串,但由于某种原因,什么都没有发生,并且在字符串中永远找不到子字符串
我尝试过使用下面的方法和'in'运算符,但我没有任何成功
这是我正在使用的方法
for tag in inputs:
for line in input_wordlist:
print(tag,line)
if tag.find(str(line)): # check here if the substring is in the string
print('YES THIS MATCHES')
vulns.append(line) #add the vulnerability to the list
这是我比较的两个值的示例 左:标签作为字符串 右:我用作子字符串的单词表中的行
<input id="q-universal-search" type="hidden" value=""/> hidden
【问题讨论】:
-
tag和line是变量字符串吗?试试if line.strip() in tag: -
什么是'tag'和'line'?你在用 BeatifulSoup 还是类似的东西?
-
@Roy2012 是的,我正在使用美丽的汤,我很抱歉没有澄清,行引用了我的文本文件中的一行,我从中提取了我的子字符串
-
什么是“标签”?是BS元素吗?
-
@AndrejKesely 我能够使用 line.rstrip() 来匹配子字符串和字符串,如果您在单词列表中没有删除的每一行中都有一个额外的 \n我想发布这个作为答案我会接受它
标签: python python-3.x web-scraping substring