python JSON 中文 unicode 的性能问题

python2.x 版的字符编码一直是大家的诟病，字典转换成json时中文字符串变成 unicode。

unicode转换

转换会转成类似这样的 \u65b0\u8f66 字符。

要想显示中文则需加个参数：

json.dumps(some_dict, ensure_ascii=False)

设置 ensure_ascii=False 可以节省大量内存，但 json 在设置 ensure_ascii=False 后性能急剧下降。ujson 还好。

Converts arbitrary object recursivly into JSON. Use ensure_ascii=false to output UTF-8. Pass in double_precision to alter the maximum digit precision of doubles. Set encode_html_chars=True to encode < > & as unicode escape sequences.

python 编码类型

在python 2或者3 ，字符串编码只有两类：

（1）通用的Unicode编码；
（2）将Unicode转化为某种类型的编码，如UTF-8，GBK；

encode()和decode()的区别

encode() 的作用是将Unicode编码的字符串转换为其他编码格式。

例如： st1.encode("utf-8") 这句的作用是将Unicode编码的st1编码为utf-8编码的字符串

decode() 的作用是把其他编码格式的字符串转换成Unicode编码的字符串。

例如： st2.decode("utf-8") 这句的作用是将utf-8编码的字符串st2解码为Unicode编码的字符串

编码之间互转

除Unicode编码的字符串以外，任何一种编码的字符串要想转换为其他编码格式，必须先解码后编码

非Unicode编码--> Unicode编码-->非Unicode编码

例如，utf-8编码的字符串st想要转换为gbk编码的字符串，必须经过以下步骤：

st=st.decode("utf-8") #解码为Unicode编码
st=st.encode("gbk") #从Unicode编码编码为gbk编码

本文网址: https://pylist.com/topic/52.html 转摘请注明来源

python 终端 print 正确显示中文

当一个py 文件里有print中文时，在终端运行时，会输出乱码...

用python 实现中文与html实体相互转换

一些网页会把中文转为html实体，做爬虫时就需要把`html实体`转换为中文，下面介绍使用python 对它们作相互转换。...

关于go json 的性能效率问题

go 标准库的json 解析很慢，要是考虑到其性能，就考虑使用其它推荐...

用python 对中文链接安全转码

当一个链接里包含中文时，有些浏览器并不能正确解析，这就需要首先对中文作安全转码，这里介绍用 python 对中文链接安全转码，...

python 分割中文英文混合字符串的正确方法

python 里的字符编码不统一导致中英文的处理有不同的结果，下面介绍中文英文混合字符串 split 的方法。...

Go 和 Python 在简单的 web 服务器方面的性能比较

在选择一种新的语言或框架之前种喜欢作性能的比较，下面是Go 和 Python 在简单的 web 服务器方面的性能比较。...

python 标准库读写CSV 文件

CSV 是（Comma Separated Values 逗号分隔值）的英文缩写，通常都是纯文本文件。这里介绍使用python 标准库读写csv 文件的方法。...

这款基于SAE Python tornado 的blog 告一段落

因为 SAE 的 Python 平台刚刚内测，平台功能还没定型，好多服务在紧张开发中，这款blog 程序也使用了前期可用的一些服务。...

python 常见的时间格式转换

这里介绍使用python 对 datetime 对象、字符串、时间戳之间的相互转换...

go json 解析速度测试

这里是使用Golang json 标准库对一个简单的 `struct` 作解析速度测试...

unicode转换

python 编码类型

encode()和decode()的区别

编码之间互转

Suggested Topics

Leave a Comment Cancel reply