加载语料库程序运行乱码

ch03/

demo_corpus_loader.py

按照这个方法还是解决不了乱码

你再试试都换为gbk

或者参考如下修改:

大致思路是将所有的open和write函数加上encoding='utf-8'
一般我都会将操作系统(包括Windows)的默认编码设为utf-8。但根据每个人不同的配置和版本,Windows可能还要将console的编码也改为utf-8,这块就得自己Google自己试了,Windows没有通用方案,是一个浪费生命的东西。