室外消防通道高度:转化为 utf-8 格式 - Python - 问友源码论坛

来源:百度文库 编辑:偶看新闻 时间:2024/04/30 02:53:14

转化为 utf-8 格式

由于网站要支持国际化, 以前用 GB2312 的脚本都要转化成 utf-8 格式. 一共有 1000 多个页面, 虽然一些文本编辑器支持转化格式, 比如 EditPlus, UE等, 但这么多的文件一个个转化也够受的. 所以准备用 Python 写了一个脚本, 负责转化目录下的所有文件成 urf-8 格式.
Python 中的 codecs 模块可以完成这个任务, 该模块可以转化很多编码, 但对我来说 utf-8 就足够, 一般支持多语言的网站都是 utf-8 的编码模式.

实现关键点:

1. 用 codecs 的 open 方式打开文件, 打开模式是只读和二进制, 即'rb'.

2. 读出文件内容, 用 encode 编码成 utf-8.

3. 用 'wb' 模式新建文件, 保存即可.

4. 另外 print 不能打印 utf-8 格式的内容, 必须先解码后再编码成 GB2312.


代码片断:复制内容到剪贴板
代码:
# -*- coding: mbcs -*-
import codecs
f = codecs.open('D:\\normal.txt', 'rb', 'mbcs')
text = f.read().encode('utf-8')
f.close
f = open('d:\\utf8.txt', 'wb')
f.write(text)
f.close()
print text.decode('utf-8').encode('gb2312')