收起
cissp数据分类方法有什么?
在日常办公和学习研究中,经常需要对数据进行分类汇总。比如在统计公司员工的工资和年龄的时候,要求根据员工的性别求出员工的平均工资和平均年龄。就会用到分类汇总的功能,本文我会用IBM SPSS Statistics进行数据的分类汇总的演示。
1、数据展示
如图所示,是一个公司的员工信息数据集。我将在此基础上,展示如何用IBM SPSS Statistics中的分类汇总功能求男女员工的平均工资和平均年龄。
2、菜单位置
第一步点击菜单栏的“数据”按钮,第二步点击下级菜单的“汇总”选项。
3、选择分界变量和变量摘要
数据分类汇总的定义是:按指定的分类变量对观测值进行分组,对每组记录的各变量求指定的描述统计量。根据定义我们不难发现,选择分界变量就是分类的过程,选择变量摘要就是汇总的过程。
如图所示,我们先选中性别将性别加入到分界变量中,这一步的目的是用性别作为分类标准。然后我们将工资和年龄选中依次加入到变量摘要中,这样我们在接下来的步骤中就可以用函数对工资和年龄进行操作。
4、选择合适的函数
如图所示,已经将变量加入到相应的位置,我们点击下方的“函数”按钮。
5、结果展示
如图所示,这里有三个选项。选择第一个我们会将数据直接生成到原先的数据集中,选择第二个会生成一个新的数据集去存储结果,选择第三个会在指定文件下保存结果。这里我们选择第一个,如果有其他需求可以根据自身情况去选择。
数据分类:更多是从业务角度出发,在企业理清数据家底后,明确知道哪些数据(其实应该是元数据,更贴切一些应该是字段)属于哪个业务范畴,也就是类别。这个业务范畴囊括的范围可大可小,完全依托于企业前期基于业务的梳理结果。举个例子:身份证号这一类数据,既可以属于个人信息范畴,也可以属于个人基本信息范畴,前者的范围明显大于后者。也许有朋友会发出疑问,给业务划分类别当然是越细越好。这就是笔者要在此处强调的,做数据分类,并不是业务越细分越好,因为很有可能细分业务之后,最终却发现无数据可进行归类,这是典型分类失败的体现。当然反过来也成立,分类少了,数据归不进去,也是分类失败的体现。
数据分级:不同于数据分类,对于大多数企业来说,更多是从满足监管要求的角度出发。数据分级属于数据安全领域,或许称呼它为敏感等级更为贴切。企业中的数据有的密级程度高、有的低、有的可公开、有的不可公开,敏感等级不同的数据对内使用时受到的保护策略不同,对外共享开放的程度也不同。如果企业对自己内部的数据没有一个明确地认识,先不说是否可以满足监管要求,对于自身的运营来说都是严重的隐患,因为很可能一不小心就将内部的敏感信息泄露了出去。