字符(Character)是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。字符集(Character set)是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、 GB18030字符集、Unicode字符集等。计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。中文文字数目大,而且还分为简体中文和繁体中文两种不同书写规则的文字,而计算机最初是按英语单字节字符设计的,因此,对中文字符进行编码,是中文信息交流的技术基础。

本文主要介绍了PHP通过iconv将字符串从GBK转换为UTF8字符集。具有很好的参考价值,下面跟着小编一起来看下吧

PHP通过iconv将字符串从GBK转换为UTF8字符集。

1. iconv()介绍

iconv函数可以将一种已知的字符集文件转换成另一种已知的字符集文件。例如:从GB2312转换为UTF-8。

iconv函数在php5中内置,GB字符集默认打开。

2. iconv()错误

iconv在转换字符”—”到gb2312时会出错,解决方法是在需要转成的编码后加 “//IGNORE”,也就是iconv函数第二个参数后.如下:

iconv("UTF-8", "GB2312//IGNORE", $data)

ignore的意思是忽略转换时的错误,如果没有ignore参数,所有该字符后面的字符串都无法被保存。

3. iconv()例子

<?php   echo $str= ‘你好,这里是卖咖啡!';   echo '<br />';   echo iconv('GB2312', 'UTF-8', $str); //将字符串的编码从GB2312转到UTF-8   echo '<br />';   echo iconv_substr($str, 1, 1, 'UTF-8'); //按字符个数截取而非字节   print_r(iconv_get_encoding()); //得到当前页面编码信息   echo iconv_strlen($str, 'UTF-8'); //得到设定编码的字符串长度 ?>

以上就是php 转换字符集的方法的详细内容,更多请关注php中文网其它相关文章!

php中文网最新课程二维码