NBA和数据挖掘

我们在学校里的时候,老师讲到“数据挖掘”,总是喜欢用啤酒和尿布做例子。这个例子实在是太生动,太贴近生活,以至于久而久之,大家都只会用这个例子了,众口一词,相当的乏味。其实,近来我发现,NBA是一个很活生生的好例子。NBA把数据挖掘用到了无处不在,时常令人有叹为观止的感叹。

例如,在最近的一期的《体育画报》里的一篇关于NBA的文章中提到:“二十年来,所有年度防守球员退役时都有枚戒指带”(言下之意,估计穆托姆博和阿泰斯特也会拿到总冠军的)。能够发掘到这样一个事实,基本上只有两种可能性:有那么一小撮对NBA掌故烂熟于胸且大脑极其发达的中年人,他/她们对一些深深隐藏在浩如烟海的数据背后的一些有趣的事实有极其敏锐的洞察力;或者NBA掌握了非常行之有效的数据挖掘技术,并运用这样的技术对其数十年如一其不厌其烦收集的数据进行了挖掘。

我比较愿意倾向于相信后面一种可能性,因为找到或者培养那种既能熟记大量数据又有敏锐洞察力的人是一件非常困难的事情,而且不具备可重复性——但我不止一次看到在涉及NBA的文章中出现那种深藏的事实,而且不单单是NBA,在美国的其他体育联盟(比如橄榄球、棒球等)里面,也经常能有类似的发现。同一期《体育画报》中另一处写道:“82games.com定义的‘关键时刻(最后5分钟双方分差小于5)’中,(Tracy McGrady)他有80%的得分靠单打的来。相反,姚明在‘关键时刻’...有高达60%的得分依赖助攻”。

从这些充满质感的数据和来自于数据中的事实中可以看出,即便不论那些数据挖掘是人做的还是计算机做的,美国的各大体育联盟对数据的收集之细,也是值得我们学习的。下次面试Senior SDE的时候不妨问这么一个问题:请设计一个NBA比赛和球员资料数据库。

Comments on “NBA和数据挖掘

  1. hippy October 19, 2008 11:03 PM

    已阅,hippy到此一游

  2. kimo October 19, 2008 11:16 PM

    作为游离在IT外的人,恳请解释啤酒,尿布和数据挖掘之间的关系.

  3. Xw.Y October 20, 2008 12:29 AM

    @kimo
    通过超市的数据挖掘发现,家庭主妇逛超市时会帮丈夫购买啤酒,并且帮婴儿购买尿布。所以将啤酒和尿布摆放在相近的地方容易提高销量。该知识并非纯IT知识,可能更偏向于管理学中的流程重组或者ERP之类的课程。

    @lz
    关于美国体育界的数据挖掘,我觉得游戏足球经理也做得相当不错,就是一个在玩数据的游戏。不过NBA的这个例子也很有趣。

  4. 刀马 October 20, 2008 02:06 AM

    比起单纯的挖掘数据,选择合理的技术统计选出优秀球员更是一门学问,这方面的典型是MLB的奥克兰运动家队的总经理(现在还是,名字忘记了。。。),用低薪签下别人不要的球员,然后打出其他超过高薪堆积起来的球队的成绩。为此有人还写了本书,叫《Money Ball》,台湾翻译为《魔球》。

    现在NBA火箭队的总经理莫雷也是师出此门派,看他选的菜鸟,那在FM里就是妖人了。

  5. omtv October 21, 2008 10:36 AM

    这方面老美做的好多啦~
    想想国内的联赛,总共就那几个指标

  6. whitewolf October 21, 2008 01:26 PM

    NBA的数据细致程度的确让人赞叹。比如nba的官网,提供一个hotzone的工具,可以很直观的每个球员最擅长的得分位置等。
    还有很多民间网站提供各类数据汇总和工具,帮助球迷们进行分析。如82games.com等。
    事实上,只要看一下nba的数字化管理程度,就知道为什么人家能发财了

  7. Fed November 4, 2008 09:03 AM

    美国数据分析太多了,商店的衣服会跟据地区和size 的不同打不同的折。寄来的coupon的面额和frequency会根据你在店里消费额不同而每月变化。特别是银行,会用程序让大额的check先于小额的cash, 这样会因账户为负而charge 两次overdraft fee,否则只能charge 一次。 最可怕是google,比CIA 还厉害。

Leave a Reply