采集时,网页为GBK不会出现问题,但若为utf-8时,在测试时会出错内容丢失问题,经测试,在function/common.func.php里的
if(!empty($encode) && $in_charset != $out_charset) {下的if语句修改为:
if (function_exists(‘mb_convert_encoding’) && (@$outstr = mb_convert_encoding($content, $out_charset, $in_charset))) {
$content = $outstr;
} elseif (function_exists(‘iconv’) && (@$outstr = iconv(“$in_charset//IGNORE”, “$out_charset//IGNORE”, $content))) {
$content = $outstr;
}
上面修改后可以测试通过,实际采集时出现采集完成,但采集内容为空,修改在admin/admin_robots.php里的function geturlfile($url, $encode=1) { 第二个IF语句,不然采集为空
if(!empty($thevalue[‘encode’]) && $encode == 1) {
if(function_exists(‘mb_convert_encoding’)) {
$text = encodeconvert($thevalue[‘encode’], $text);
} else {
$text = iconv($thevalue[‘encode’], $_SCONFIG[‘charset’], $text);
}
}
Supesite采集utf-8页面时内容出错或为空解决:等您坐沙发呢!