加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

数据分析图例

发布时间:2020-12-14 04:16:08 所属栏目:大数据 来源:网络整理
导读:1、饼图 用于分析一种特征中两种数值所占比例。 train_data[ ‘ Survived ‘ ].value_counts().plot.pie(autopct= ‘ %1.2f%% ‘ ) ?? ? 2、柱状图 分析两维特征间的关系。 train_data[[ ‘ Sex ‘ , ‘ Survived ‘ ]].groupby([ ‘ Sex ‘ ]).mean().plot.

1、饼图

用于分析一种特征中两种数值所占比例。

train_data[Survived].value_counts().plot.pie(autopct=%1.2f%%)

??

?

2、柱状图

分析两维特征间的关系。

train_data[[Sex,Survived]].groupby([Sex]).mean().plot.bar()

?

sns的柱状图

sns.countplot(Embarked,hue=Survived,data=train_data)

?

?

3、直方图

是一种可视化在连续间隔,或者是特定时间段内数据分布情况的图表。直方图描述的是一组数据的频次分布。

柱状图展示的不同分类的数量分布。

train_data[Age].hist(bins=70)

?bins,数据划分的份数。

?

sns提供的直方图

average_data = train_data[[age_int,Survived]].groupby(age_int,as_index=False).mean()
sns.barplot(x=age_int,y=Survived,data=average_data)

?

?

5、琴图

?在柱状图的基础上,琴图展示的内容可以更加丰富,可以同时展示三个数值间的关系。下图展示了不同Pclass下的不同年龄的生还和死亡的人数的比例。

琴图的黑线上,同时可以看到年龄的分布,黑线上粗线的两端表示年龄的最小和最大值,白色的点表示年龄的平均值。

用于分析这里使用seaborn(matplotlib的一个扩展库)

import seaborn as sns
sns.violinplot(Pclass,Age,data=train_data,split=True,ax=ax[0])

?

?6、箱型图

?箱型图和琴图中的黑线表示类似。

a) 箱图的上下连个黑线:最小和最大值。

b) 中间方框的上下边缘:上四分位数和下四分位数。

c) 绿线:中位数

d) 圆点:异常值

showfilters,是否展示异常值。

train_data.boxplot(column=Age,showfliers=False)

train_data.boxplot(column=Fare,by=Pclass,showfliers=True)

7、密度图

facet = sns.FacetGrid(train_data,aspect=4)
# kdeplot,密度图
facet.map(sns.kdeplot,shade=True)

?

?

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读