登录 注册

在数据分析时,如何区别[维度]和[指标]?

很多同学在面临数据分析时,常常面临海量的数据类型。而最大的问题就是,如何利用这些数据进行建模。这里提出维度和指标两个概念,也是数据分析时最常见的两个概念,他们分别代表什么呢?又该如何进行区分?怎样利用他们来建模?

3个回复

  • 符号帝国 青春留不住,白发自然生
    说一点不同的看法;

    个人认为城市、性别、时间段这类不能作为维度,这类变量属于分类变量,利用分类变量可以数据整体分为若干个组,并进行组与组之间的对比;在建模中这种分类变量一般作为控制变量出现;

    维度应该是剖析事物的方法或者是分析问题的方向,例如我要建立一个【外卖平台竞争力模型】,从哪几个方向去考察外卖平台的竞争力呢?可以从配送方面、商家方面以及保障方面;也就是说可以从这三个维度去分析外卖平台的竞争力;

    指标是用来具体衡量某个维度的,例如我们怎么衡量“配送”这个维度呢?可以从配送的平均时间、配送的准点率,自营配送队伍人员数,自营配送队伍占比;也就是说可以从这四个指标去衡量配送这个维度;

    关于建模,首先要知道自己要干嘛,要解释或解决什么问题,确定要建什么模型,再看相关文献或资料总结可以从哪几个维度去分析,有的时候一个大维度下面还有若干个小维度,最后将维度细化到具体可衡量的指标,再选择合适的数学模型,一个建模就完成了。

    当然在现在的研究中(我接触过的课题),也有不提维度,用一级指标、二级指标、三级指标来描述,但本质意思是一样的。
  • 云淡风轻 时间是审查一切罪犯的最老练的法官
    A:你选择女朋友有哪些(维度)上的要求?

    B:身高要高,腿要长,三维要好。

    A:具体指标是啥?

    B:身高165cm以上,腿要80cm以上,三维是36 24 36。




    数据是瞎写的,哈哈,36 24 36来自《独自等待》哈哈。

    个人见解,供参考。谢谢。
  • 呵呵哒 青春是不耐久藏的东西
    数据分析其实是个很难的活,你需要考虑从哪些方面去分析,然后每个方面分析哪些数据才能得到一些结论。我理解哪些方面就是维度,每个方面下的具体数据就是指标。

    举例:我在小区门口开了个小卖部,我想分析一下近一个月内各商品的销售情况,以决定明天的进货量(假设我每个月进一次货)。

    分析过程:

    一、确定三个大维度

          任何数据分析问题我都先拆解成三个维度:物,人,物+人;这里也就是商品,顾客,商品+顾客这三个大的维度。

    二、大维度拆解成小维度

          1.就商品而言,我需要了解:

            A.一个月内商品的周转情况(进了多少货,卖出了多少);

            B.一个月内,不同商品的盈利情况;

            C.此外,我还想从局部看下每天的分布是怎样的。(总体+局部)

         2.从顾客的角度,我想了解:

           A.顾客的人口统计特征分布(顾客都是些什么人);

           B.单顾客创造的营业额、利润分布(顾客花多少钱,我能赚多少);

           C.单天客流量及访问时间段的分布(大家都什么时候来);

        3.从商品+顾客的角度,我想看:

           A.不同属性的用户,购买每类产品(零食,生鲜,日用品等)的转化,购买数量及分布(不同类别的人都最爱买什么);

          B.不同(统计特征)属性的用户,不同商品类别带来的营业额、利润及其分布(不同类别的人都爱买什么,哪类人可以给我带来最高利润);

          C.利润最高的用户,不同类别下购买时段的分布(利润最高的用户,都是什么时候来买东西)。

          D.利润最高的用户,购买商品的分布(利润最高的用户,都爱买什么)。

    三、小维度下的指标

        1.就商品而言,需要分析的指标有:

         A&B的统计指标:商品ID,商品名称,商品单价,商品大小(特大/大/中/小四档),总进货量,总销售量,总营业额,总成本,总净利润;统计时间:近一个月,按月统计。

        C的统计指标:商品ID,商品名(筛选后),日期,销售量,营业额,净利润;统计时间:近一个月,按天统计。

       2.就顾客而言,需要分析的指标有:

        A&B的统计指标:顾客ID,性别,年龄,身份,月访问次数,月购买次数,月营业额,月利润;统计时间,近一个月,按月统计。

       C的统计指标:顾客ID,日期,访问时间段,访问次数;统计时间,近一周,按天统计。

       3.就顾客&商品而言,需要分析的指标有:

        A&B的统计指标:用户属性类别,商品类别,月访问次数,月购买数量,月营业额,月利润;统计时间:近一个月,按月统计。

        C的统计指标:用户属性类别,商品类别,日期,购买时间段,购买次数;统计时间,近一周,按天统计。

        D的统计指标:用户属性类别,商品类别,商品名称,购买次数。统计时间,近一个月,按月统计。

    四、添删改查

       根据实际需求,投入产出比,优先级,对上述的维度进行筛选和修改;

       根据业务需求,对上述维度进行补充,例如:上述分析第三部分主要分析了高利润用户的特性和习惯,但对未购买的用户,购买次数多但利润不高的用户分析较少。更好地满足高利润用户的需求,转化低(无)贡献的用户是两种不同的思路。

       最后,上述数据如果能够结合模型和机器学习等智能分析手段,可以分析出更多更有价值的内容。如不同商品间的关联性(喜欢买A,B的人,都会喜欢买C),如不同类别用户之间的特性,大量购买XXX保健品的用户,一个月后都会大量购买婴儿产品(XXX保健品为孕期的常用保健品),如XXX季节,XXXX天气下,XXX和XXX商品的销量会激增。
登录参与讨论

相关问题