加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

Perl帮MM轻松搞定Excel数据

发布时间:2020-12-16 00:39:09 所属栏目:大数据 来源:网络整理
导读:某日,与公司海外推广部MM聊天。MM在与我一边聊天的同时,还一边处理着手头上的工作。于是,我好奇的问了一下MM的工作情况。她告诉我她现在正在处理一个excel文件,此文件中密密麻麻的记录着一些信息。有一列中完全是公司某一网站的的url,类似于这样 她说,

某日,与公司海外推广部MM聊天。MM在与我一边聊天的同时,还一边处理着手头上的工作。于是,我好奇的问了一下MM的工作情况。她告诉我她现在正在处理一个excel文件,此文件中密密麻麻的记录着一些信息。有一列中完全是公司某一网站的的url,类似于这样

她说,她要逐个点击其中的url地址,并在IE中查看该url中下面项的值

当Wholesale price (如上图)所在行的us$后面值大于20时,就将该url记录下来(MM的本意是只要Wholesale price 后面的us$后面的值大于20时,即将该行标注成红色,这里稍微修改一下)。起初,MM是click one by one,该文件中此类的url不下100个,MM手都点酸了,眼也看花了,终于把工作做完了。之后,我说,你就是这样天天工作的呀,不烦才怪呢,效率不高不说,而且容易出错。好了吧,GG我帮你写个程序,这样的工作怎么能由MM的纤纤玉手亲自来做呢,一切交给电脑来处理吧。

要用perl来处理这个问题,需要用到两个module,一个是LWP::Simple,另一个则是Spreadsheet::ParseExcel,初次不知道怎么用的,请perldoc modulename.

这里附上perl 代码

 
 
  1. #!/usr/bin/perl?-w?
  2. ?
  3. use?strict;?
  4. use?LWP::Simple;?
  5. use?Spreadsheet::ParseExcel;?
  6. ?
  7. my?@array;?
  8. ?
  9. my?$parser???=?Spreadsheet::ParseExcel->new();?
  10. my?$workbook?=?$parser->parse('第二期统计.xls');?
  11. ?
  12. if?(?!defined?$workbook?)?{?
  13. ????die?$parser->error(),".n";?
  14. }?
  15. ?
  16. for?my?$worksheet?(?$workbook->worksheets()?)?{?
  17. ?
  18. ????my?(?$row_min,$row_max?)?=?$worksheet->row_range();?
  19. ?
  20. #本来下面一句应该是这样写的
  21. #for my $row ( $row_min..$row_max ),之所以换成2,是因为想过滤掉第一行中的那几个中文字符,哈哈
  22. ????for?my?$row?(?2..$row_max?)?{?
  23. ?
  24. #下面一句换成1的目的是为了与第二列数据相匹配
  25. ????????my?$cell?=?$worksheet->get_cell(?$row,1?);?
  26. ????????next?unless?$cell;?
  27. ?
  28. ????????my?$tmp_url?=?$cell->value();?
  29. ????????push?@array,$tmp_url;?
  30. ?
  31. ????}?
  32. ?
  33. }?
  34. ?
  35. for?my?$url?( @array )?{?
  36. ?
  37. ????my?$content?=?get?$url?or?die?"can't?get?$urln";?
  38. ????print?$url,"n";?
  39. ?
  40. ????if?( $content?=~ /wholesale_price/ )?{?
  41. ????????$content?=~?m{<S+s+w+="S+"s+w+="S+">US$s+(d+.d+)</w+>};?
  42. ?
  43. ????????open?RES,'>>','results.txt'?or?die?"$!n";?
  44. ?
  45. ????????if?( $1?>?20 )?{?
  46. ????????????print?"$urln";?
  47. ????????????print?RES?"$urln";?
  48. ????????}?
  49. ?
  50. ????????close?RES;?
  51. ?
  52. ????}?
  53. ?
  54. }?
结果在results.txt中
 
 
  1. [root@web?~]#?cat?results.txt??
  2. http://www.wholesale-dress.net/lapel-long-sleeve-single-button-front-suit-light-grey-g1158909.html?
  3. http://www.wholesale-dress.net/korea-style-zipped-stand-collar-jacket-khaki-g1228884.html

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读