关于 Unicode 和乱码恢复的基本原理
Unicode是个包含了字符集、编码方案的统一码 如果要转换编码,就要先从原始编码转换到Unicode,然后从Unicode再转换到目标编码
假设现在 有一个日文程序在中文系统下生成了乱码文件名,文件名被复制到utf-8的txt里面以后要如何还原呢?
- 将utf-8 转换成 gbk ,也就是先转Unicode,再从Unicode转gbk
- 将第一步的gbk字符转Unicode,并设置源编码为 cp932
- 将上一步得到的Unicode转成 utf-8。