python编程时乱码,python代码很乱啊

dfnjsfkhak 2024-10-07 6 0

大家好，今天小编关注到一个比较有意思的话题，就是关于python 编程时乱码的问题，于是小编就整理了3个相关介绍 Python编程时乱码的解答，让我们一起看看吧。

python3连接MSSQL数据库，中文乱码怎么解决？
python爬虫一部分中文乱码一部分中文正常，如何解决？
Python语言是不是有设计缺陷？

python3连接MSSQL数据库，中文乱码怎么解决？

根据自身情况设置连接编码：conn=pymssql.connect(host=".",user="sa",password="123456",database="ddd",charset="GB2312")

python爬虫一部分中文乱码一部分中文正常，如何解决？

有时候并不都是自己的问题，有些网站程序员程序员的问题，一会用utf8编码一会用gbk编码，也会出现这个问题，如果是正常网站他的编码格式在头部里是有的，抓下来网页按照头部指示编码转码就可以了

python编程时乱码,python代码很乱啊-第1张图片-芜湖力博教育咨询公司

（图片来源网络，侵删）

查看网页头部的方法如下：

第一:查看网页源码 <meta ***-equiv="content-type" content="text/html;charset=utf-8"> 确定"charset"编码，然后代码获取内容后将编码转换成对应的编码

第二:申明编码

python编程时乱码,python代码很乱啊-第2张图片-芜湖力博教育咨询公司

（图片来源网络，侵删）

import requests

url = '***s://***.toutiao***/i6536316510376296968/'

res = requests.get(url)

python编程时乱码,python代码很乱啊-第3张图片-芜湖力博教育咨询公司

（图片来源网络，侵删）

res.encoding = 'utf-8'

这个问题还没碰见过，一部分中文乱码，一部分中文正常，一般情况下，一个网页的编码格式就一种，不可能好几种，要么都正常，要么都乱码，不清楚你是用哪个包做的爬虫，我这里简单的以requests包为例，介绍一下，如何设置网页编码，使中文正常显示，实验环境win7+python3.6+pycharm，主要步骤如下：

1.这里为了方便演示，我以百度一下网址***s://***.baidu***/为例，用requests的get方法请求一下这个页面，代码如下：

程序运行结果如下，可以看得出来，页面的编码方式为ISO-8859-1：

而ISO-8859-1本身不支持中文，所以页面中文内容显示为乱码，如下图：

2.为了支持中文显示，我们这里可以重新设置一下页面编码，如下，只要支持中文就行，如utf-8等都可以，代码如下：

3.程序运行结果如下，已经成功显示出页面的中文内容，没有乱码的出现：

前段时间在做爬虫时遇到过这类的问题，requests的响应内容乱码，之所以出现了乱码，是因为没有正确识别出网页的encoding编码。

要想不乱码，正确逻辑应该是请求到一个网页后判断其编码，比如gb2312，utf-8等，然后使用正确的编码来解码。

所以关键在于正确的判断网站的编码，可以通过网站的html中的charset参数来判断。

这个可以自己写一个正则来获取，网上也有不少的轮子。但是requests模块中已经自带该方法了，就不用重复造轮子了。看requests源码:

所以请求到网页内容后先调用 apparent_encoding方法，得到网页的编码，直接用encoding方法使其正确解码，一般来说就不会乱码了