咱们通常所说的数据可视化是指狭义的数据可视化,行将数据以图表的方式启动出现,经常出现于PPT、报表、资讯等场景。图表是数据可视化最基础的运行,它代表图形化的数据,通常以所用的图形符号命名,例如经常使用圆形符号的饼图、经常使用线条符号的折线图等。上方引见一些经常出现的图表,并联合一些运行场景给出图示意例。
1.折线图
折线图是将数据标注成点,并经过直线将这些点按某种顺序衔接而成的图表,它以折线的方式笼统地反映事物沿某个维度的变动趋向,能够明晰地展现数据增减的趋向、速率、法令及峰值等特色。折线图普通将时期序列作为x轴的数据,将时期序列对应的数值作为y轴的数据,实用于反映具备固定时时期隔的数据的变动趋向的场景,例如股票剖析、天气预告等。例如,海口市4月23-29日的最高气平和最低气温的变动状况如图1-4所示。
图1 海口市4月23-29日的最高气虚和最低气温的变动状况
2.柱形图
柱形图是由一系列宽度相等的纵向矩形条组成的图表,它应用矩形条的高度示意数值,以此反映不同分类数据之间的差异。械形图普通将分类作为x轴的数据,将各分类对应的值作为y轴的数据,实用于中小规模数据集的各分类之间比拟的场景。例如,2-2018年阿里巴巴公司的营业支出状况如图2所示。
图2 2一2018年阿里巴巴公司的营业支出状况
3.条形图
条形图是横置的柱形图,由一系列高度相等、长短不一的横向矩形条组成。与柱形图相比,条形图更实用于矩形条数量较多的场所,但普通倡导矩形条的数量不超越30个。例如,2019年上半年快手用户对各类商品广告的关注率如图3所示。
图3 2019年上半年快手用户对各类商品广告的关注率
4.沉积图
沉积图分为沉积面积图、沉积柱形图和沉积条形图。其中沉积面积图是由若干折线与折线或水平坐标轴之间的填充区域组成的图表,它的最大区域是一个代表一切数据总和的全体,沉积的各区域代表各组数据,用于反映全体与局部的相关:沉积柱形图和沉积条形图是由若干个以颜色或线条填充、高度不一的纵向矩形条或横向矩形条堆叠而成的图表,用于反映每个构成局部在总体中的比重。例如,2017年世界及各地域一次性性动力的生产结构如图4所示。
图4 2017年世界及各地域一次性性动力的生产结构
5.直方图
直方图又称质量散布图,是由一系列高下不等的纵向矩形条或线段组成的图表,用于反映数据的散布和动摇状况。直方图通常将延续型数据宰割成若干个不堆叠的值范围分段,以此作为x轴的数据,将每个范围分段中统计的值频率作为y轴的数据,实用于了解产质量量的散布法令、预算施工环节中的不合格率等工程畛域,或许识别人脸特色的人工默认畛域。例如,某厂商对100个抽样产品的质量级别评定状况如图5所示。
图5 某厂商对100个抽样产品的质量级别评定
留意:
柱形图与直方图展现的成果十分相似,但两者又所不同,关键区别为:
(1)柱形图用于展现团圆型数据(记载不同类别的数据)的散布,而直方图用于展现延续型数据(必定区间内延续数值所组成的数提)的散布;
(2)柱形图的各矩形条之间具备固定的间惊,而直方图的各矩形条之间没有任何间隙。
6.箱形图
箱形图又称盒须图、箱线图,是令种应用数据中的5个统计量(最小值、下四分位数、中位数、上四分位数和最大值锚述数据的图表,关键用于反映一组或多组数据的对称性、散布水平等消息,因状态如箱子而得名。箱形图能够识别意外值、判别偏态与尾重、比拟数据状态,实用于质量治理的场景。例如,不同厂家所产地毯的耐用性比拟如图6所示。
图6 不同厂家所产地毯的耐用性
图6中4个图形从左到右依次代表厂家1、厂家2、厂家3和厂家4所产的地毯。由图6可知,每个图形的结构相反,包含一个矩形箱体、上下两条竖线、上下两条横线,其中箱体代表数据的集中范围,上下两条竖线区分代表数据向上和向下的加长范围,上下两条横线区分代表最大值和最小值。若数据中存在意外值(也称为离群值),则会以圆圈的方式显示到图中横线上方或下方。为了便于了解,上方经过图7来形容箱形的结构及意外值。
图7 箱形的结构及意外值
7.饼图
饼图是由若干个面积大小不一、以条形或颜色填的扇形组成的圆形图表,它经常使用圆示意数据的总量,组成圆的每个扇形示意数据中各项占总量的比例大小,关键用于显示数据中各项大小与各项总和的比例。饼图中的圆与扇形区分代表全体与局部,可以笼统地展现数据全体与各项数据的相关,实用于极速了解全体数据中各项数据调配状况的场景。例如,2018年全国居民的人均生产支出状况如图11新示。
图8 2018年全国居民的人均生产支出状况
值得一提的是,圆环图也能显示各项与全体之间的相关,它经常使用圆环示意全体,组成圆环的每个楔形示意各项的占比,外形像空心的圆饼。与饼图相比,圆环图可以展现多组数据的比例,但并不容易被人们了解,很多时刻可以用沉积柱形图或沉积条形图代替。
8.散点图
散点图又称X-Y图,是由若干个数据点组成的图表,关键用于判别两变量之间能否存在某种关联,或许总结数据点的散布形式。散点图中数据点的散布状况可以表现变量之间的相关性:若一切的数据点在一条直线左近呈动摇趋向,说明变量之间是线性相关的;若数据点在曲线左近呈动摇趋向,说明变量之间是非线性相关的:若数据点没有显示任何相关,说明变量之间是不相关的,经常出现于剖析两变量相关性的场景。例如,股票报答率与基金报答率的投资剖析情限如图8所示。
图9 股票报答率与基金报答半的投资剖析状况
9.气泡图
气泡图是散点图的变形,它是一和能够展现多变量相关的图表。气泡图普通经常使用两个变量标注气泡在坐标系中的位置,经常使用3个变量标注气泡的面积,实用于分类数据对比、多变量相关性等状况,经常出现于财数据剖析中。例如,第1梯队和第2梯队干流App用户量与上线时期的散布状况如图10所示。
图10 第1梯队和第2梯队干流App用户量与上线时期的散布状况
值得一提的是,气泡图中过多的气泡会参与图表的浏览难度,因此气泡的数量不宜过多。为了能在有限的气泡中展现更多的消息,可以给气泡图中的气泡参与交互配置,单击该气泡图1-13第1梯队和第2梯队干流App用户量与上线时期的散布状况
值得一提的是,气泡图中过多的气泡会参与图表的浏览难度,因此气泡的数量不宜过多。为了能在有限的气泡中展现更多的消息,可以给气泡图中的气泡参与交互配置,单击该气泡即可检查其暗藏的消息。
10.误差棒图
误差棒图是经常使用误差棒注明被测量数据的不确定度大小的图表,用于示意测量数据中主观存在的测量偏向(规范差或规范误差)。误差棒图中误差棒是以被测量数据的平均值为中点,在示意测量值大小的方向上画出的一条线段,线段长度的一半为不确定度。例如,某市区上年降雨量的统计剖析如图11所示。
图11 某市区年降雨量的统计剖析
11.雷达图
区图,由一组坐标轴和多个等距同心圆或多边形组成,雷达图又称蜘蛛网图、星状图、是一种表现多维(4维以上)数据的图表。雷达图中的坐标轴起始于同一个圆心点,完结于最中心圆周边缘,每个坐标轴代表一个目的,其上方会将多个维度的数据映射成点,衔接数据点围成一个多边形,实用于对多目的对象做出全局性、全体性评估的场景,经常出现于企业经菲状况的评估和财务剖析。例如,某人经过霍兰德职业兴味测试的结果如图11所示。
图12 某人经过霍兰德职业兴味测试的结果
12.统计地图
统计地图是一种以地图为背景,经常使用各种线纹、色调、几何图形或实物笼统标注目的数值及其在不同天文位置的散布状况的图表。统计地图关键用于说明某些现象在地域上的散布,实用于比拟人口、资源、产量等在各地域的散布状况。例如,某平台朔州市用户的地域散布状况如图12所示。
图13 2021年2月1日中国新型冠状病毒肺炎疫情地图
13.3D图表
3D图表是一类在三维坐标系中出现数据的图表。罕用的3D图表包含3D散点图、3D折线图、3D曲面图、3D直方图、3D柱形图等。与2Q 相比,3D图表的成果更为酷炫,其在视觉上的表现力更强,且可仿真很多场景,实用于金融、气候、天文、修建、交通等场景。例如,豆粕期权隐含动摇率如图14所示。
图14 豆粕期权隐含动摇率