加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

对19大代表进行一波数据分析

发布时间:2020-12-14 04:59:09 所属栏目:大数据 来源:网络整理
导读:今年共有2287名代表赴京开会.做了一个数据分析.效果如下图.其他也可以筛选出其他的,比如说姓xx的多少个,姓xx的多少个.我可以明确地告诉你,姓习的只有一个,那就是我习大大. 准备工作: 获取所有代表信息这个是公开的,在百度百科可以找到. 数据分析 第一步将获

今年共有2287名代表赴京开会.做了一个数据分析.效果如下图.其他也可以筛选出其他的,比如说姓xx的多少个,姓xx的多少个.我可以明确地告诉你,姓习的只有一个,那就是我习大大.

准备工作:

获取所有代表信息这个是公开的,在百度百科可以找到.

数据分析

  1. 第一步将获取的所有代表信息字符串转换为数组
    可以使用match 也可以用split
    代码如下:

    我们得到一个2287长度的数组 如下:

    [0] => 乙晓光 
       [1] => 丁宁(女) 
       [2] => 丁琪(回族) 
       [3] => 丁小强 
       [4] => 丁业现 
       [5] => 丁向阳 
       [6] => 丁红都 
       [7] => 丁志峰 
       [8] => 丁来杭 
       [9] => 丁学东 
       [10] => 丁荣军 
       [11] => 丁唯秀(女) 
       [12] => 丁薛祥 
       [13] => 卜宪群 
       [14] => 乃依木·亚森(维吾尔族) 
       [15] => 于勇
       ...

    2.提取出姓名中的姓(少数民族的我取的是点号前面的 如 阿里巴巴·杰克马 我取阿里巴巴为姓)

    我们得到一个2287长度的数组 如下:

    [0] => 乙
       [1] => 丁 
       [2] => 丁
       [3] => 丁
       [4] => 丁
       [5] => 丁
       [6] => 丁
       [7] => 丁
       [8] => 丁
       [9] => 丁
       [10] => 丁
       [11] => 丁
       [12] => 丁 
       [13] => 卜 
       [14] => 乃依木 
       [15] => 于
       ...

    3.计算每个姓氏有多少人

    返回一个数组 如下:

    Array
       (
           [0] => 0
           [1] => Array
               (
                   [0] => 乙
                   [1] => 1
               )
       
           [2] => Array
               (
                   [0] => 丁
                   [1] => 12
               )
       
           [3] => Array
               (
                   [0] => 卜
                   [1] => 1
               )
       
           [4] => Array
               (
                   [0] => 乃依木
                   [1] => 1
               )
4.对数据进行排序,按姓氏数量进行降序

5.统计女性和少数名族 只要对姓名进行一个正则判断

6.百分比 可以通过已有的数据计算得到 如(女性数量/总人数*100)

代码写得有点渣

预览代码
下载代码

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读