加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

数据分析与挖掘实战1

发布时间:2020-12-14 04:48:45 所属栏目:大数据 来源:网络整理
导读:import pandas as pdimport matplotlib.pyplot as pltimport mathimport numpy as np#sales[sales.isna().values==True]def pin_lv(arr): return arr.count()/sales.describe().loc[‘count‘]sale_path = ‘E:philworkspaceselfworkpythonpython pract
import pandas as pd
import matplotlib.pyplot as plt
import math
import numpy as np

#sales[sales.isna().values==True]

def pin_lv(arr):
    return arr.count()/sales.describe().loc[‘count‘]


sale_path = ‘E:philworkspaceselfworkpythonpython practice of data analysis and miningchapter3catering_sale.xls‘
sales = pd.read_excel(sale_path,index_col=‘date‘)
sales = sales.dropna()
sales_describe = sales.describe()
# 极差
sales_describe.loc[‘ji_cha‘] = sales_describe.loc[‘max‘] - sales_describe.loc[‘min‘]
fen_zu_shu = math.ceil(sales_describe.loc[‘ji_cha‘] / 1000)
# 分组间隔
list_fen_zu = []
for index in range(fen_zu_shu + 1):
    list_fen_zu.append(index * 1000)

fen_zu_qu_jian = pd.cut(sales[‘sale‘],list_fen_zu)
group = sales.groupby(by=fen_zu_qu_jian)

group = group.agg([‘count‘,‘sum‘,pin_lv])
# 删除列的第一个分组sales
group.columns = group.columns.droplevel()
group[‘lei_ji‘] = group[‘pin_lv‘].cumsum(skipna=True)
# 填充nan的值,向前填充
group[‘lei_ji‘] = group[‘lei_ji‘].fillna(method=‘ffill‘)

group.plot.bar(logy=True,figsize=[12,6],rot=15)
plt.show()

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读