【发布时间】:2022-07-20 08:48:35
【问题描述】:
我正在尝试将单词翻译成另一种语言(如印地语、中文、俄语等)并将它们存储在 .txt 文件中。我已成功对数据进行编码并将其写入文件,但我无法以相同的方式读取它。
例如,如果我将“我”翻译成印地语,我会得到“मुझे”作为结果(这很好)。此外,我的文件中也印有同样的内容。但我无法以同样的方式提取它。
文件中写入的文本:我(英语):(印地语)मुझे
我希望如何提取它:我(英语):(印地语)मुझे
我如何得到它:ÿþme(英语):(印地语)。 A ↔ G
截图:
代码:
import googletrans as GT
text = "me"
translator = GT.Translator()
raw_trans = translator.translate(text, dest="hi", src="en")
translation = raw_trans.text
print(f"Translation : {translation}")
with open("lango.txt", "wb") as writer:
information = f"{text} (English) : (Hindi) {translation}"
info = information.encode(encoding="utf-16")
writer.write(info)
with open("lango.txt", "r") as reader:
correct_info = reader.read()
print(correct_info)
请帮我解决这个问题。
【问题讨论】:
-
ÿþ是utf-16-le中的Byte order mark,在cp1252中解释(参见Byte order marks by encoding)。
标签: python python-3.x encoding google-translate