调用json数据时乱码的解决方法
今天为SEO得分实时查询添加新的功能,抓取所测的网站titele。依旧用file_get_contents获取网页的内容,然后再用正则来匹配。事情发展的很顺利,花了两个小时,终于把网页的title给获取到了。可是....到了测试的时候,发现有几个乱码出现,比如获取seo科学之美和优词网时,seo科学之美的这个网站的title正常显示,可是到了优词网,却出现了一大堆乱码了。
老规矩,到相应的网站上,查看源代码,发现网页的编码不一样,seo科学之美的是utf-8,而优词网的却是gb2312,看来问题就出现在这里了,因为php中json_encode这个函数生成的json数据都是utf-8的,如果别的编码用此函数来转换的话,就会出现恐怖的乱码。
既然问题找到了,就要说说是怎么解决的了:
一:首页是要判断获取的页面是什么编码的。
二:判断好了之后。就要对相应的字符串进行转化了,这里默认都是utf-8,所以如果遇到是gb2312的网站,就要用iconv来进行转换了。
三:转换好之后,就可以用json_encode来生成json数据,然后调用了。
下面是其中一部分的图解:
ps:最重要的一点。文件一定是utf-8无BOM编码格式的!!!
分享按钮
老规矩,到相应的网站上,查看源代码,发现网页的编码不一样,seo科学之美的是utf-8,而优词网的却是gb2312,看来问题就出现在这里了,因为php中json_encode这个函数生成的json数据都是utf-8的,如果别的编码用此函数来转换的话,就会出现恐怖的乱码。
既然问题找到了,就要说说是怎么解决的了:
一:首页是要判断获取的页面是什么编码的。
二:判断好了之后。就要对相应的字符串进行转化了,这里默认都是utf-8,所以如果遇到是gb2312的网站,就要用iconv来进行转换了。
三:转换好之后,就可以用json_encode来生成json数据,然后调用了。
下面是其中一部分的图解:
ps:最重要的一点。文件一定是utf-8无BOM编码格式的!!!