【问题标题】:Date format issue when i web-scraping into excel?网页抓取到excel时的日期格式问题?
【发布时间】:2017-12-06 11:44:45
【问题描述】:

我正在使用 python 2.7 从网站抓取数据,然后将它们导出到 excel。 但我在 excel 中遇到格式问题: 在网站上有:“9/18”,我在 excel 中得到“18.sept”。

如何以“9/18”格式保存这些值?

这是我的代码:

filename=r'output.csv'

resultcsv=open(filename,"wb")
output=csv.writer(resultcsv, delimiter=';',quotechar = '"', quoting=csv.QUOTE_NONNUMERIC, encoding='latin-1')
 
f = open('0910000511.txt', 'r')
x = f.read()

soup = BeautifulSoup(x, 'lxml')

datatable=[]
for ctable in soup.find_all('table',  "ctable" )[:-1]:
    for record in ctable.find_all('tr'):
        temp_data = []
        for data in record.find_all('td'):
            temp_data.append(data.text.encode('latin-1'))
        datatable.append(temp_data)


tab6col = soup.find('table', { "class" : "tab6col" })
datatable2=[]
for record in tab6col.find_all('tr'):
    temp_data2 = []
    for data in record.find_all('td'):
        temp_data2.append(data.text.encode('latin-1'))
    datatable.append(temp_data2)

output.writerows(datatable)

resultcsv.close()

【问题讨论】:

  • 这是一个格式问题,edit 你的问题,展示你如何编写 Excel。
  • 我只使用“import unicodecsv as csv”,所以这是问题所在?如何正确使用这个 xlsx 包?
  • 拥有文本文件的副本或生成文本文件的 URL 会有所帮助。
  • 我知道如何在 Excel 中更改日期格式。我只是问它,是否可以以这种格式保存这些值,而不是手动进行。

标签: python excel csv date web-scraping


【解决方案1】:

问题
我只是问它,是否可以以这种格式保存这些值,而不是手动进行。

存在 NO 保留,因为 String 没有分配格式。

考虑您的数据流:

scrap `Date string` 
-> csv.write `Date string` 
-> Excel imports from CSV `Date string` 

Excel Magic检测Date string并将其转换为DATE类型。
Excel 使用默认值显示所有类型为 DATE 的单元格 日期格式,生成 DAY.SHORTMONTHNAME

您有 2 个选项:

  1. 在 Excel 中更改 Date Format
    您可以手动执行此操作,也可以使用 VBA 脚本。

  2. 使用xslx package 写入您抓取的数据并评估您的 日期格式(“9/18”)到Date Cells
    注意:此 SO 答案未显示如何执行 NumberFormat
    SO Answer Solution using openpyxl
    SO Answer cell.number_format
    openpyxl - A Python library to read/write Excel 2010 xlsx/xlsm files

【讨论】:

    猜你喜欢
    • 2021-07-25
    • 2013-02-08
    • 2021-12-23
    • 2016-08-03
    • 2014-05-16
    • 2022-01-22
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多