
数据分析图表
-
2023年3月5日发(作者:深圳四大名校高中)数据分析——可视化图表
1、柱状图
展⽰多个分类的数据变化和同类别各变量之间的⽐较情况。
适⽤:对⽐分类数据(⽐较不同的数值)。
局限:分类过多则⽆法展⽰数据特点。
相似图表:
1)堆积柱状图。⽐较同类别各变量和不同类别变量总和差异。
2)百分⽐堆积柱状图。适合展⽰同类别的每个变量的⽐例。
2、条形图
类似柱状图,只不过两根轴对调了⼀下。
适⽤:类别名称过长,将有⼤量空⽩位置标⽰每个类别的名称(可⽐较数值、可对⽐)。
局限:分类过多则⽆法展⽰数据特点。
相似图表:
1)堆积条形图。⽐较同类别各变量和不同类别变量总和差异。
2)百分⽐堆积条形图。适合展⽰同类别的每个变量的⽐例。
3)双向柱状图。⽐较同类别的正反向数值差异。
3、折线图
展⽰数据随时间或有序类别的波动情况的趋势变化。
适⽤:有序的类别,⽐如时间(在⼀定范围“时间”内渐变)。
局限:⽆序的类别⽆法展⽰数据特点。
相似图表:
1)⾯积图。⽤⾯积展⽰数值⼤⼩。展⽰数量随时间变化的趋势。
2)堆积⾯积图。同类别各变量和不同类别变量总和差异。
3)百分⽐堆积⾯积图。⽐较同类别的各个变量的⽐例差异。
4、柱线图
结合柱状图和折线图在同⼀个图表展现数据。
适⽤:要同时展现两个项⽬数据的特点。
局限:有柱状图和折线图两者的缺陷。
5、散点图
⽤于发现各变量之间的关系。
适⽤:存在⼤量数据点,结果更精准,⽐如回归分析(⽐较分布情况)。
局限:数据量⼩的时候会⽐较混乱。
相似图表:⽓泡图。⽤⽓泡代替散点图的数值点,⾯积⼤⼩代表数值⼤⼩。
6、饼图
⽤来展⽰各类别占⽐,⽐如男⼥⽐例。
适⽤:了解数据的分布情况(按百分⽐分配,中和唯⼀,体现各部分所占⽐例)。
缺陷:分类过多,则扇形越⼩,⽆法展现图表。
相似图表:
1)环形图。挖空的饼图,中间区域可以展现数据或者⽂本信息。
2)玫瑰饼图。对⽐不同类别的数值⼤⼩。
3)旭⽇图。展⽰⽗⼦层级的不同类别数据的占⽐。
7、地图
⽤颜⾊的深浅来展⽰区域范围的数值⼤⼩。
适合:展现呈⾯状但属分散分布的数据,⽐如⼈⼝密度等(适⽤于数据在地理位置上空间分布情况。)。
局限:数据分布和地理区域⼤⼩的不对称。通常⼤量数据会集中在地理区域范围⼩的⼈⼝密集区,容易造成⽤户对数据的误解。
相似图表:
1)⽓泡地图。⽤⽓泡⼤⼩展现数据量⼤⼩。
2)点状地图。⽤描点展现数据在区域的分布情况。
3)轨迹地图。展现运动轨迹。
8、热⼒图
以特殊⾼亮的形式显⽰访客热衷的页⾯区域和访客所在的地理区域的图⽰。
适合:可以直观清楚地看到页⾯上每⼀个区域的访客兴趣焦点(适⽤于数据空间分布状态)。
局限:不适⽤于数值字段是汇总值,需要连续数值数据分布。
9、矩形树图
展现同⼀层级的不同分类的占⽐情况,还可以同⼀个分类下⼦级的占⽐情况,⽐如商品品类等。
适⽤:展⽰⽗⼦层级占⽐的树形数据(可⽤于多个实体体现占有率)。
缺陷:不适合展现不同层级的数据,⽐如组织架构图,每个分类不适合放在⼀起看占⽐情况。
10、指标卡
突出显⽰⼀两个关键的数据结果,⽐如同⽐环⽐。
适合:展⽰最终结果和关键数据(直观的显⽰单个数据的变化量等直观数据。)。
缺陷:没有分类对⽐,只展⽰单⼀数据。
11、词云
展现⽂本信息,对出现频率较⾼的“关键词”予以视觉上的突出,⽐如⽤户画像的标签。
适合:在⼤量⽂本中提取关键词(适⽤于展⽰热门词汇)。
局限:不适⽤于数据太少或数据区分度不⼤的⽂本。
12、仪表盘
展现某个指标的完成情况。
适合:展⽰项⽬进度(展⽰进度)。
局限:只适合展现数据的累计情况,不适⽤于数据的分布特征等。
13、雷达图
将多个分类的数据量映射到坐标轴上,对⽐某项⽬不同属性的特点。
适⽤:了解同类别的不同属性的综合情况,以及⽐较不同类别的相同属性差异。
局限:分类过多或变量过多,会⽐较混乱。
14、漏⽃图
⽤梯形⾯积表⽰某个环节业务量与上⼀个环节之间的差异。
适⽤:有固定流程并且环节较多的分析,可以直观地显⽰转化率和流失率(表⽰了强烈的逻辑关系和流程关系)。
局限:⽆序的类别或者没有流程关系的变量。
15、瀑布图
采⽤绝对值与相对值结合的⽅式,展⽰各成分分布构成情况,⽐如各项⽣活开⽀的占⽐情况。
适合:展⽰数据的累计变化过程。
局限:各类别数据差别太⼤则难以⽐较。
16、桑葚图
⼀种特定类型的流程图,图中延伸的分⽀的宽度对应数据流量的⼤⼩,起始流量总和始终与结束流量总和保持平衡。⽐如能量流动等。
适合:⽤来表⽰数据的流向。
局限:不适⽤于边的起始流量和结束流量不同的场景。⽐如使⽤⼿机的品牌变化。
相似图表:1)和弦图。展现矩阵中数据间相互关系和流量变化。数据节点如果过多则不适⽤。
17、箱线图
是利⽤数据中的五个统计量:最⼩值、第⼀四分位数、中位数、第三四分位数与最⼤值来描述数据的⼀种⽅法。
适⽤:⽤来展⽰⼀组数据分散情况,特别⽤于对⼏个样本的⽐较。
局限:对于⼤数据量,反应的形状信息更加模糊。