在php中用嵌入的html计数单词
发布时间:2020-12-13 16:48:55 所属栏目:PHP教程 来源:网络整理
导读:我有一些相当大的段落(5000-6000字)包含文本和嵌入的 HTML标签.我想用1500字的块(忽略其中的html标记)打破这个大段,即1500应该只包括实际的单词,而不是任何标记单词.使用函数strip_tags我可以计算单词的数量(忽略html标记),但我无法弄清楚如何以1500字(仍然
我有一些相当大的段落(5000-6000字)包含文本和嵌入的
HTML标签.我想用1500字的块(忽略其中的html标记)打破这个大段,即1500应该只包括实际的单词,而不是任何标记单词.使用函数strip_tags我可以计算单词的数量(忽略html标记),但我无法弄清楚如何以1500字(仍然包括html标记)的块来打破它.例如
This is <b> a </b> paragraph which <a href="#"> has some </a> some text to be broken in <h1> 5 words </h1>. 结果应该是 1 = This is <b> a </b> paragraph which 2 = <a href="#"> has some </a> some text to 3 = be broken in <h1> 5 words </h1>. 解决方法
考虑明智地使用explode()函数.或者更好,但更长 – 正则表达式将匹配单词或标签以及其中的所有文本.您应该将html标记内的元素视为牢不可破的实体.例如,您可以编写一个函数,将大段落分成以下几个实体:
$data = array( array( "count" => 2,"text" => "This is "),array( "count" => 1,"text" => "<b> a </b>"),array( "count" => 2,"text" => " paragraph which"),... etc. ); 然后,你应该编写一个循环,它将从$data数组中生成小段落. 此外,有时候你的段落长度不会超过1500字.它可以或多或少,因为你不应该将你的html标签分开. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |