有时候我们需要清洗数据,里面有超链接,怎么去掉他们,比如下面的问题
><em>View More Works</em></div></a></div></li></ul></div>
第一种方法:
用这则替换,把 href 替换为 hre1f 就可以了,
第二种方法:
result_div_list = re.findall('<(.*?)>',str(result_div))
if 'href' in str(result_div_list): for ii in result_div_list: if 'href' in ii: item_desc = str(result_div).replace(str(ii) ,'') else: item_desc = result_div
记录下来,供以后学习参考