如果写文件出现乱码,试试python的codecs

在读取 utf8中文是如果出现乱码,可以使用codecs

import codecs

with codecs.open('tb_d1.txt', 'r',encoding='utf-8') as f:
    for line in f.readlines():
        words_1.add(line.strip())

写过程如下:

#!/usr/bin/python
#coding=utf-8


import codecs
file = codecs.open('file.txt','w','utf-8')
file.write(u'写文件乱码\n')
file.close()

文件读写模式 最为常见的三种模式,见下表,其中模式就是指获取文件对象时传入的参数,最常用的是前三个。

模式 描述
r 仅读,待打开的文件必须存在
w 仅写,若文件已存在,内容将先被清空
a 仅写,若文件已存在,内容不会清空
r+ 读写,待打开的文件必须存在
w+ 读写,若文件已存在,内容将先被清空
a+ 读写,若文件已存在,内容不会清空
rb 仅读,二进制,待打开的文件必须存在
wb 仅写,二进制,若文件已存在,内容将先被清空
ab 仅写,二进制,若文件已存在,内容不会清空
r+b 读写,二进制,待打开的文件必须存在
w+b 读写,二进制,若文件已存在,内容将先被清空
a+b 读写,二进制,若文件已存在,内容不会清空

转载请标明来之:http://www.bugingcode.com/

更多教程:阿猫学编程