调用json数据时乱码的解决方法

今天为SEO得分实时查询添加新的功能，抓取所测的网站titele。依旧用file_get_contents获取网页的内容，然后再用正则来匹配。事情发展的很顺利，花了两个小时，终于把网页的title给获取到了。可是....到了测试的时候，发现有几个乱码出现，比如获取seo科学之美和优词网时，seo科学之美的这个网站的title正常显示，可是到了优词网，却出现了一大堆乱码了。

老规矩，到相应的网站上，查看源代码，发现网页的编码不一样，seo科学之美的是utf-8，而优词网的却是gb2312，看来问题就出现在这里了，因为php中json_encode这个函数生成的json数据都是utf-8的，如果别的编码用此函数来转换的话，就会出现恐怖的乱码。

既然问题找到了，就要说说是怎么解决的了：

一：首页是要判断获取的页面是什么编码的。

二：判断好了之后。就要对相应的字符串进行转化了，这里默认都是utf-8，所以如果遇到是gb2312的网站，就要用iconv来进行转换了。

三：转换好之后，就可以用json_encode来生成json数据，然后调用了。

下面是其中一部分的图解：

ps：最重要的一点。文件一定是utf-8无BOM编码格式的！！！

WJMonitor舆情之声

调用json数据时乱码的解决方法

最新文章

热门文章