主要函数是file_get_contents,主程序分两段,跟我一起看过来吧(凡人博客原创代码,转载请注明)。 <div class="codetitle"><a style="CURSOR: pointer" data="37923" class="copybut" id="copybut37923" onclick="doCopy('code37923')"> 代码如下:<div class="codebody" id="code37923"> function escape($str){ preg_match_all('/[x80-xff].|[x01-x7f]+/',$str,$r); $ar = $r[0]; foreach($ar as $k=>$v){ if(ord($v[0]) < 128) $ar[$k] = rawurlencode($v); else $ar[$k] = '%u'.bin2hex(iconv('GB2312','UCS-2',$v)); } return join('',$ar); } 上面的函数主要是用php实现JavaScript的escape编码过程,因为洪恩的查询接口需要传递过去的值是经过escape编码后的成语条目。 <div class="codetitle"><a style="CURSOR: pointer" data="29637" class="copybut" id="copybut29637" onclick="doCopy('code29637')"> 代码如下:<div class="codebody" id="code29637"> function chacy($chengyu){ $chengyu=escape($chengyu); $text=@file_get_contents('http://study.hongen.com/dict/ndsearchchengyu.aspx?type=exact&word='.$chengyu); $pos1=strpos($text,'<table class="root">'); $pos2=strrpos($text,'<table class="english">'); $text=substr($text,$pos1,$pos2-$pos1); //把字符集由原来的UTF-8转换到GB2312,注意在GB2312之后加上了//IGNORE,强制遇到特殊字符也继续转换,因为在遇到汉字“一”的时候iconv函数会终止转换 $text=iconv('UTF-8','GB2312//IGNORE',$text); if (strpos($text,'出处')){ return $text; } } 上面是自己定义的成语查询函数,首先escape编码要查询的成语条目,然后使用file_get_contents函数获取“http://study.hongen.com/dict/ndsearchchengyu.aspx?type=exact&word=”页面查询的内容,使用substr去除前后一些不需要的多余代码,中间就是成语条目的解释部分(包括拼音、解释、出处、例句),最后记得要转码,洪恩返回的结果是UTF-8编码,一般情况下我们需要转换为GB2312编码,上面我写了一个有关iconv函数转换编码有时会出现bug的注释文本,需要加上一个//IGNORE参数。最后判断结果中是否存在“出处”二字,有的话说明整个函数运行成功,可以把获取到的内容return给页面了。 程序主体实现完成,只需在相应位置调用查询函数:chacy 就可以了。 (编辑:李大同)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|