400-685-0732

WJMonitor舆情之声

企业大数据智能舆情监测管理解决方案

全网监测海量数据按需发布监测预警

实时把握舆情动态精准追溯信息源头

获取验证码
企业采购 个人使用
当前位置: 首页 > SEO博客 > 调用json数据时乱码的解决方法

调用json数据时乱码的解决方法

时间:2012-12-27 16:02:41
今天为SEO得分实时查询添加新的功能,抓取所测的网站titele。依旧用file_get_contents获取网页的内容,然后再用正则来匹配。事情发展的很顺利,花了两个小时,终于把网页的title给获取到了。可是....到了测试的时候,发现有几个乱码出现,比如获取seo科学之美优词网时,seo科学之美的这个网站的title正常显示,可是到了优词网,却出现了一大堆乱码了。

老规矩,到相应的网站上,查看源代码,发现网页的编码不一样,seo科学之美的是utf-8,而优词网的却是gb2312,看来问题就出现在这里了,因为php中json_encode这个函数生成的json数据都是utf-8的,如果别的编码用此函数来转换的话,就会出现恐怖的乱码。

既然问题找到了,就要说说是怎么解决的了:

一:首页是要判断获取的页面是什么编码的。

二:判断好了之后。就要对相应的字符串进行转化了,这里默认都是utf-8,所以如果遇到是gb2312的网站,就要用iconv来进行转换了。

三:转换好之后,就可以用json_encode来生成json数据,然后调用了。

下面是其中一部分的图解:


ps:最重要的一点。文件一定是utf-8无BOM编码格式的!!!

 
分享按钮