加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > PHP教程 > 正文

在php中用嵌入的html计数单词

发布时间:2020-12-13 16:48:55 所属栏目:PHP教程 来源:网络整理
导读:我有一些相当大的段落(5000-6000字)包含文本和嵌入的 HTML标签.我想用1500字的块(忽略其中的html标记)打破这个大段,即1500应该只包括实际的单词,而不是任何标记单词.使用函数strip_tags我可以计算单词的数量(忽略html标记),但我无法弄清楚如何以1500字(仍然
我有一些相当大的段落(5000-6000字)包含文本和嵌入的 HTML标签.我想用1500字的块(忽略其中的html标记)打破这个大段,即1500应该只包括实际的单词,而不是任何标记单词.使用函数strip_tags我可以计算单词的数量(忽略html标记),但我无法弄清楚如何以1500字(仍然包括html标记)的块来打破它.例如

This is <b> a </b> paragraph which <a href="#"> has some </a> some text to be broken in <h1> 5 words </h1>.

结果应该是

1 = This is <b> a </b> paragraph which
2 = <a href="#"> has some </a> some text to
3 = be broken in <h1> 5 words </h1>.

解决方法

考虑明智地使用explode()函数.或者更好,但更长 – 正则表达式将匹配单词或标签以及其中的所有文本.您应该将html标记内的元素视为牢不可破的实体.例如,您可以编写一个函数,将大段落分成以下几个实体:

$data = array(
  array( "count" => 2,"text" => "This is "),array( "count" => 1,"text" => "<b> a </b>"),array( "count" => 2,"text" => " paragraph which"),...
  etc.
);

然后,你应该编写一个循环,它将从$data数组中生成小段落.

此外,有时候你的段落长度不会超过1500字.它可以或多或少,因为你不应该将你的html标签分开.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读