作者:乐多体育 | 发表于:2022-11-21 | 阅读:39次

Excel中的透视表(pivot table)在日常工作中可以说是经常会用到,它可以很方便地让我们对数据中的不同的维度(dimension)进行计算。举个很简单的例子,比如在零售行业中,大型超市的数据库记录了每天物品的卖出情况,但记录是比较分散的,如果想知道整个二月份的销售额,或者二月份文具总共的销售额是多少等等这样的计算。

下面就用一个实际的例子来分享,在我的上篇文章中我介绍了如何用Excel把NBA一场比赛的数据从非结构化的数据转换成结构化的数据,而机构化的数据就可以存入数据库中,而我把数据存入了同样是Office软件家庭中的Access Database。当然,如果数据量不大的话,放在Excel的一个Spreadsheet也是可以的。

今天这个例子还是用NBA的数据来做一个实际的操演。在我的数据库中,我记录的信息有这些:在字符型数据中有赛季,赛段,比赛时间,球队,球员等;在数字型数据中有上场时间,得分,篮板,助攻,抢断,盖帽等数据。

在我们看比赛的时候,解说员经常会提到某个球员的场均得分,下面咱们就用Excel中的pivot table来计算出勇士队场均得分。

场均得分的计算公式就是总得分除以参加比赛的场次,首先计算总得分。如下图Ctrl A选中所有数据,在插入中选择透视表(pivot table)然后在新的一页中打开。把要计算的得分放入数值Value格中,把球员放入筛选Filter中,然后寻找勇士队即可,我们可以看到勇士总得分为2461分。

下面再来计算勇士队的比赛场次,在这个计算中,我们通过计算勇士队所参加的比赛不同的天数就可以知道勇士队参加比赛的场次。具体步骤如下:

这个步骤有个小细节,如果要计算比赛不用的天数,有一个选项是“distinct count”,直白点说就是计算这一列不同值的数量。举个例子,如果一列中的数值有:“苹果”,“苹果”,“香蕉”。如果不用distinct count,直接count是3个,如果用distinct count的话就是2个。如果需要有“distinct count”那就需要在设置pivot table的时候选中这个选项

中文是“添加到数据模型中”,这样就可以开始进行“distinct count”了。另外,distinct count从技术上来说在数据分析工作中会经常用到,所以一定要充分考虑到使用distinct count的场景。在不同的数据分析软件中有不同的方法来实现。

这个计算结果是勇士队参加的比赛场次是22场,下面就用总得分除以场次就可以得到场均得分:在F6中输入=C4/H4就可以得到最终数据,是111.86分。

如果想要查看其他球队的场均得分的话,可以把filter中的勇士队换成其他球队就可以。但如果在报告中建的pivot table太多了还要一个个改吗?这里再分享一个就是切片器(slicer)。如下图:

点击一个透视表的任意位置,再插入(insert)中选择切片器,选中球队,然后右击切片器,在切片器联动(report connection)中选中另一个透视表即可。如果不知道透视表名字的话,可以点击透视表分析,左上角显示透视表名字。

我们在工作中可能见过动态报告,就是点击一下,整个页面的数据就会随之改变,这其中就是用到的切片器。可以给大家展示一个我用Excel做的NBA比赛的一个简单的动态可视化报告,仅供参考。

希望今天的分享能帮到大家。

图自网络,侵删。

特别声明:所有资讯或言论仅代表发布者个人意见,乐多体育仅提供发布平台,信息内容请自行判断。

标签: 透视 实例 数据

相关资讯