【发布时间】:2015-03-05 09:02:48
【问题描述】:
我有下一个代码
# __author__ = 'Vahagn'
# -*- coding: utf-8 -*-
import BeautifulSoup
import requests
req = requests.get(u"http://knowledge.allbest.ru/chemistry/3c0a65635a3ad68b5c53b88421306c27.html")
s2 = BeautifulSoup.BeautifulSoup(req.content).find('p',{'class':'text'}).text
print(s2+'\n')
我将 s2 发送到控制台或写入文件的位置
Õèìè÷åñêèå ñâîéñòâà. Ìèíåðàëû. Ìåäíûå ñïëàâû. Ìàðêè ìåäíûõ ñïëàâîâ. Ìåäíî-öèíêîâûå ñïëàâû. Ëàòóíè. Îëîâÿííûå áðîíçû. Àëþìèíèåâûå áðîíçû. Êðåìíèñòûå áðîíçû. Áåðèëëèåâûå áðîíçû. Ìåäü â ïðîìûøëåííîñòè. Ìåäü â æèçíè ðàñòåíèé è æèâîòíûõ.
但是需要
Химические свойства. Минералы. Медные сплавы. Марки медных сплавов. Медно-цинковые сплавы. Латуни. Оловянные бронзы. Алюминиевые бронзы. Кремнистые бронзы. Бериллиевые бронзы. Медь в промышленности. Медь в жизни растений и животных.
请帮助,我该如何修复它,因为在此文本(s2)之后写入 mysql。谢谢你。
【问题讨论】:
-
你真的应该使用 beautifulSoup4
-
它对我来说很好,问题在于您的系统编码。你用的是python 2还是3?
-
你在哪里运行代码?
req.encoding输出什么? -
req.encoding -> windows - 1251