BOM 头是什么,怎么除去件
旧版本的 windows 自带的记事本(新版已经没了),在保存一个以 UTF-8 编码的文件时,会在文件开始的地方插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM)。
它是一串隐藏的字符,用于让记事本等编辑器识别这个文件是否以 UTF-8 编码。对于一般的文本文件,这样并不会产生什么麻烦。但对于 PHP 代码来说,BOM 是个大麻烦。
PHP并不会忽略BOM,所以在读取、包含或者引用这些文件时,会把 BOM 作为该文件开头正文的一部分。根据html混编语言的特点,这串字符将被直接执行(显示)出来。由此造成即使页面的 top padding 设置为0,也无法让整个网页紧贴浏览器顶部,因为在html一开头有这3个字符呢!
而且 BOM 是内容输入,如果没有开启缓冲区输出的时候,BOM 会影响 header 函数的使用,因为在header之前不能有任何有效的内容输出,BOM也算是有效内容输出。
去掉BOM的方法,建议使用专业的代码编辑器工具来处理 例如 Notepad++ 或者 EditPlus 在新建和保存以及转换编码的功能内都会有无 BOM的格式选择。
shell下可以利用 sed 命令来处理
sed -i '0,/s/^\xEF\xBB\xBF//' 文本文件.txt