解决：UnicodeDecodeError: 'utf-8' codec can't decode的问题

解决：UnicodeDecodeError: 'utf-8' codec can't decode的问题

解决：UnicodeDecodeError: 'utf-8' codec can't decode的问题

代码是基于TensorFlow的一个模型，与词向量有关，一运行便出现UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbd in position 0: invalid continuation byte 的错误，上网百度了好多，也尝试了一些方法解决，无果。

最终在实验室同学的帮助下解决了这个问题。

1、百度最先给出的方法当然是在文件头加

# -*- coding: utf-8 -*-

# coding: utf-8

基本没用，

2、注意所打开文件的编码方式，我也检查了，确实是utf-8

3、打开文件的方式

解决：UnicodeDecodeError: 'utf-8' codec can't decode的问题

同样报错。

4、最后我们检查了我需要读入的数据文件，发现设置的3000000行，结果实际数据只有2998583行，存在空行，所以才报错。

解决：UnicodeDecodeError: 'utf-8' codec can't decode的问题

找到问题以后，我们就设置只让它读到2998583：

（在utils_any2vec文件的第374行改了一下），如下：

解决：UnicodeDecodeError: 'utf-8' codec can't decode的问题

数据读入以后，代码就没有报错了。

解决：UnicodeDecodeError: 'utf-8' codec can't decode的问题

相关文章：

猜你喜欢

相关资源

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode