【问题标题】:python is doubling (" ") to ("" "") how can i fix thispython将(“”)加倍到(“”“”)我该如何解决这个问题
【发布时间】:2018-09-17 02:28:37
【问题描述】:

这是我在没有添加网站的情况下使用的代码示例。

from bs4 import BeautifulSoup
import requests
import csv
import random as rd
source = requests.get('http://example.com').text
file = open('C:/xampp/htdocs/new-site/text.php', 'w')
soup = BeautifulSoup(source, 'lxml')
header = soup.find('p', class_='StoryHead').text
Program_Title = 'Program Title'
CSS = '<link rel="stylesheet" href="./css.css">'
start =  CSS + '<div id="yo">' + '<div id="first">' + '<h1>' + '\n' + '\n' + \
Program_Title + '\n' + header + '</h1>' + '</div id="first">'

csv_writer = csv.writer(file) 
csv_writer.writerow( start )

这里:代码中的一些结果,但是你可以看到代码是双精度的(“”)

"<link rel=""stylesheet"" href=""./css.css""><div id=""yo""><div id=""first""> 
<h1>

【问题讨论】:

  • 您的代码无法执行(example.com 上没有“StoryHead”类的段落;文件路径是绝对路径,不适用于其他计算机)。在我解决了这些问题并将start 保存为 CSV 文件后,我得到了非常不同的结果:每个字符都放在单独的列中。所以,我有三个问题: 1. 这真的是您用来生成和保存数据的代码吗? 2. 为什么要将 HTML 保存到 CSV 文件中?这是一种非常不寻常的文本存储形式,尤其是 HTML。 3.为什么文件有PHP扩展名?
  • 请在评论前阅读描述(“我在没有添加网站的情况下使用的代码”)。项目的结果不应该是相关的,我概述了我希望解决的问题,即将 ("" "") 的输出更改为 (" ")。谢谢。
  • 这是什么意思 - “没有添加网站”?无论如何,既然你在做一些非常不寻常的事情,我想我会问一堆问题来引导你远离可能的麻烦,但祝你好运。
  • 老实说,我想为此道歉,它变得更加活泼和粗鲁,然后我打算这样做,我只是对这个问题感到非常恼火并试图解决它。我对我写的方式感到遗憾,希望你有一个美好的一天。再次非常抱歉。
  • 正如 DYZ 已经说过的,使用 csv 模块将 HTML 数据写入 .php 文件没有任何意义。 csv 编写器将您的引号加倍,因为这就是 csv 转义引号的方式。为什么你使用 csv 模块将字符串写入文件?

标签: python html python-3.x beautifulsoup


【解决方案1】:

这似乎来自 csv 编写器对双引号的转义。 默认的引号字符必须是 (")。

尝试:

csv_writer = csv.writer(file, delimiter=',', quotechar='\\')

编辑:更新 csv.writer 的参数

【讨论】:

    【解决方案2】:

    将 CSV 功能更改为仅写入默认写入

    file = open('C:/xampp/htdocs/new-site/text.php', 'w')
    #content here
    csv_writer = csv.writer(file) 
    csv_writer.writerow( start )
    

    到这里:

    file = open('C:/xampp/htdocs/new-site/text.php', 'w')
    #content here
    file.write(start)
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2020-03-25
      • 2020-02-14
      • 2019-02-08
      • 1970-01-01
      相关资源
      最近更新 更多