【发布时间】:2016-05-11 23:38:57
【问题描述】:
我在使用 python 3 解码接收到的字节时遇到问题。我正在通过串行连接控制 arduino 并使用以下代码读取它:
import serial
arduino = serial.Serial('/dev/ttyACM0', baudrate=9600, timeout=20)
print(arduino.isOpen())
myData = arduino.readline()
print(myData)
我得到的结果看起来像b'\xe1\x02\xc1\x032\x82\x83\x10\x83\xb2\x80\xb0\x92\x0b\xa0' 或b'\xe1\x02"\xe1\x00\x83\x92\x810\x82\xb2\x82\x91\xb2\n' 并尝试通过myData.decode('utf-8') 以通常的方式对其进行解码,但我收到错误UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb2 in position 1: invalid start byte。我尝试了其他解码(ASCII、cp437、十六进制、utf-16),但总是遇到同样的错误。
您有什么建议,我如何解码接收到的字节或 arduino 需要哪种解码?我已经尝试使用 for 循环逐段解码它,但我总是遇到相同的错误消息。
有没有一种通用的方法可以避免解码问题或找出我必须使用哪种解码?
提前致谢。
【问题讨论】:
-
arduino 发送什么样的数据?
-
您需要知道编码是什么才能正确解码。查看发送数据的任何内容的文档,并希望他们费心指定这些字节应该是什么。然后,解码
try-except块中的数据,并编写一个错误处理函数来处理不可避免的异常......因为无论规范怎么说,你迟早都会收到垃圾输入。 -
为什么你认为这应该是文本数据?关于编码,为了人类,请在编写任何其他代码行之前阅读joelonsoftware.com/articles/Unicode.html。但是编码在这里看起来不像您的问题 - 这可能是二进制数据。
-
没有 方式 是 ASCII。查看以
8到f开头的所有字节......这些字节中的none 是合法的ASCII。\x02也很可疑。 (you 上一次使用 Start-Of-Text 控制字符是什么时候?)另外,还有一个 Backspace 隐藏在其中 (\x10)。 -
您的大部分挫败感是由于将 bytes 和 characters 混为一谈造成的。几十年前,它们非常相似,以至于老师可以假装它们是同义词,但如今,角色显然是不同的生物。对这些差异以及如何在 Python 中处理它们的最佳演示是 Ned Batchelder 在 PyCon 2012 上的 36 分钟讲座,“Pragmatic Unicode, or, How Do I Stop the Pain?” (on You Tube)。
标签: python python-3.x decoding utf8-decode bytestream