czmiracle

想要爬取网站内容,一般先打开网站,获取请求地址以及请求参数(data),具体代码如下:

import urllib.request
import urllib.parse
import json

content=input(\'Enter the word that needs translated:\')
url=\'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule\'#_o要去掉,否则会出先error_code:50的报错
data={}
#以下为审查元素,可以在网站翻译页面按F12查看,i和doctype键不可少,其他都可以删除,不影响爬取翻译
data[\'i\']=content
data[\'from\']=\'AUTO\'
data[\'to\']=\'AUTO\'
data[\'smartresult\']=\'dict\'
data[\'client\']=\'fanyideskweb\'
data[\'salt\']=\'15601659811655\'
data[\'sign\']=\'78817b046452f9663a2b36604f220360\'
data[\'doctype\']=\'json\'
data[\'version\']=\'2.1\'
data[\'keyfrom\']=\'fanyi.web\'
data[\'action\']=\'FY_BY_REALTTIME\'
data=urllib.parse.urlencode(data).encode(\'utf-8\')
response=urllib.request.urlopen(url,data)
html=response.read().decode(\'utf-8\')
target=json.loads(html)
print(\'result:%s\'%(target[\'translateResult\'][0][0][\'tgt\']))

 

分类:

技术点:

相关文章:

  • 2021-11-30
  • 2021-12-10
  • 2021-05-26
  • 2021-11-24
  • 2021-08-25
  • 2021-11-13
猜你喜欢
  • 2022-12-23
  • 2021-12-20
  • 2021-12-20
相关资源
相似解决方案