使用perl从txt文件中删除项目符号
发布时间:2020-12-16 06:19:14 所属栏目:大数据 来源:网络整理
导读:我正在编写一个perl脚本来处理文本文件.我需要从文本文件中删除项目符号并创建一个没有项目符号的新项目符号.当我查看文本文件的二进制版本时,项目符号存储为unicode项目符号(0xe280a2).如何从字符串中删除子弹. 我试过以下代码: open($filehandle,':encodi
我正在编写一个perl脚本来处理文本文件.我需要从文本文件中删除项目符号并创建一个没有项目符号的新项目符号.当我查看文本文件的二进制版本时,项目符号存储为unicode项目符号(0xe280a2).如何从字符串中删除子弹.
我试过以下代码: open($filehandle,'<:encoding(UTF-8)',$filename) or die "Could not open file '$filename' $!"; while ($row = <$filehandle>) { @txt_str = split(/?/,$row); $row = join(" ",@txt_str); } 解决方法
反斜杠在这里没有帮助,因为子弹不是正则表达式中的特殊字符.
如果指定输入为UTF-8,则应搜索UTF-8项目符号.要这样做,要么前置 use utf8; 并将脚本保存为UTF-8;或者,使用 N{BULLET} 在您的情况下,拆分和连接可以通过空间简单替换子弹来代替: while (<$filehandle>) { s/N{BULLET}/ /g; # or s/?/ /g under utf8 print; # <-- this was missing in your code } (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |