加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > CMS系统 > Dedecms > 正文

修复DEDECMS5.5采集功能的一些bug

发布时间:2020-12-14 03:45:48 所属栏目:Dedecms 来源:网络整理
导读:修复1:将开始标签和结束标签以在网页源码中第一次出现的位置为准 修改文件includededecollection.class.php 在成员函数GetHtmlArea中的 $posend = @strpos($html,$areaRules[1],$posstart); 语句前增加语句: $posstart=$posstart+strlen($areaRules[0]);

修复1:将开始标签和结束标签以在网页源码中第一次出现的位置为准
修改文件includededecollection.class.php
在成员函数GetHtmlArea中的
$posend = @strpos($html,$areaRules[1],$posstart);
语句前增加语句:
$posstart=$posstart+strlen($areaRules[0]);
将:
return substr($html,$posstart+strlen($areaRules[0]),$posend-$posstart-strlen($areaRules[0]));
替换为:
return substr($html,$posstart,$posend-$posstart);

修复2:下载图片时对图片的扩展名判断错误
相同文件


eregi(".gif",$v)
替换为
eregi(".gif$",$url)

eregi(".png",$v)
替换为
eregi(".png$",$url)

修复3:采集软件地址的正则表达式不准确
includededecollection.func.php
将TurnLinkTag函数中
preg_match_all("/<a(?:.*)href=['"](.+?)['"]([^>]+?)>(.+?)</a>/is",$body,$match);
换为:
preg_match_all("/<a(?:[^>]+?)hrefs*=s*['"]?([^s>"']+)([^>]+?)>(.+?)</a>/is",$match);
修复4:采集图片的正则表达式不准确
相同文件

preg_match_all('/src=['"](.+?)['"]/is',$match);
 $ttx = '';
 if(is_array($match[1]) && count($match[1])>0)
 {
  for($i=0;isset($match[1][$i]);$i++)
  {
   $ttx .= "{dede:img text='' }".$match[1][$i]." {/dede:img}"."";
  }
 }
改为
$patten = "/<s*imgs.*?srcs*=s*(["'])?(?(1)(.*?)1|([^s>"']+))/isx";
    preg_match_all( $patten,$images );
    $returnArray1 = $images[2];
    $returnArray2 = $images[3];
    foreach ( $returnArray1 as $key => $value )
    {
        if ( $value )
        {
            $ttx .= "{dede:img ddimg='$litpicname' text='图 ".($key+1)."'}".$value."{/dede:img}"."";
        }
        else
        {
            $ttx .= "{dede:img ddimg='$litpicname' text='图 ".($key+1)."'}".$returnArray2[$key]."{/dede:img}"."";
        }

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读