UnicodeDecodeError: 'gbk' codec can't decode byte 0x80

大奸猫

25853人浏览 · 2019-03-23 10:01:30

大奸猫 · 2019-03-23 10:01:30 发布

文章目录

问题
原因
解决方法

问题

在打开一个html文件的时候，提示UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x80。
Unicode解码错误：gbk编码无法被解码。
在这里插入图片描述

原因

要打开的文件是UTF-8编码，用记事本打开再另存为可以看到文件的编码。
文件虽然是utf8编码，但是在计算机里面存储的还是unicode编码数据，即计算机是将文件的内容按照utf8编码成unicode后存到了硬盘上
用open()函数打开文件的时候没有指定编码
而现在执行f.read()的时候，因为没有指定编码，f.read()可能是发现文件中有中文，所以按照gbk来试图将unicode解码，但是因为文件本身是utf8的，应该按UTF-8去解码，所以解码失败。

解决方法

方法一：可以在open()函数打开文件时，指定文件的编码方式是UTF-8，如下图所示：
方法二：不让pycharm对unicode编码解码，直接读取unicode编码，即在open函数中，指定读取方式是’rb’，b代表读取二进制编码文件，unicode就是二进制编码。

Unicode（统一码、万国码、单一码）是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的，它为每种语言中的每个字符设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求。

在这里插入图片描述

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

[转载]在Windows环境下安装GNU Radio

转自：在Windows环境下安装GNURadio_恐弱智_新浪博客GNU Radio是用Python开发的，大部分开源的工程能够在Linux环境下运行良好，而Windows下却运行的很勉强，而且安装配置都很复杂。GNU Radio算是个例外了，不光提供了Windows的二进制安装，还有比较详细的说明。我是Python小白，所以折腾了好久才弄好，特意记录下来，免得以后再装还折腾。GNU Radio的

GitCode 开源社区

centOS 8 使用dnf安装Docker

DNF是什么？CentOS 8使用YUM软件包管理器版本v4.0.4。现在，该版本使用DNF(已删除YUM)。DNF是软件包管理器。它会在Linux发行版上安装，执行更新并删除软件包。使用DNF安装Docker跳过具有损坏依赖性的程序包一个有效的解决方案是使您的CentOS 8系统使用以下--nobest命令安装最符合条件的版本：sudo dnf install docker...

GitCode 开源社区

定时同步数据库表(mysql+linux+crontab)

sync.sh里面的参数需要改变，ip/username/password/database/tablesync.sh#!/bin/sh# Please change the IP and password of the data source db.# Then change the table name.filename=/home/nington/db/$(date +%Y-%m