【发布时间】:2019-07-27 12:02:45
【问题描述】:
我正在尝试从不同的站点提取数据和信息。我编写了一个脚本,它运行良好,但是,当我尝试打印结果时,会出现一些问题,比如结果就像句子一样,没有逗号没有分隔符。没有我自己试过,什么也没有。
这是我正在开发的网站http://www.conditions-de-banque-tunisie.com/banques-en-tunisie.html
我试图在结果和空之间加一个逗号。逗号在最后,仅此而已。
linksname.find_all('p')[i].text + ','
import requests
import bs4
import csv
import io
response = requests.get('http://www.conditions-de-banque-tunisie.com/banques-en-tunisie.html')
response.status_code
soup_obj = bs4.BeautifulSoup(response.text, "html.parser")
soup_obj.prettify()
#print('shhh')
linksname = soup_obj.find(class_='bloc-banques-liste')
#linksname.text
textContent = []
for i in range(0,1): links = linksname.find_all('p')[i].text
textContent.append(links)
for text in textContent:
print('----------------------------')
print(text)
with io.open("fname.txt", "w", encoding="utf-8") as f: f.write(text)
这是结果:
北非国际银行地址:Avenue Kheireddine Pacha Ennassim Montplaisir 1002 TUNISTé:+216 71 950 800传真:+216 71 950 840网站:http://www.naibbank.com/
Qatar National BankAdresse : Rue de la cité des Sciences - B.P. 320 - 1080 Tunis CedexTé:+216 71 750 000传真:+216 71 235 611网站:http://www.qnb.com.tn/
我希望结果会是这样的:
北非国际银行,地址:Avenue Kheireddine Pacha Ennassim Montplaisir 1002,突尼斯:+216 71 950 800,传真:+216 71 950 840,网站:http://www.naibbank.com/
或者最好的结果是:
北非国际银行,地点 Kheireddine Pacha Ennassim Montplaisir 1002,+216 71 950 800,+216 71 950 840,:http://www.naibbank.com/
【问题讨论】:
-
此时您应该接受以下答案之一。
标签: python web-scraping