加载中 ...
首页 > 个股 > 个股新闻 > 正文

[600509天富热电]我的命中率比杜兰特要高?

2024-01-30 11:19:13 来源:盛楚鉫鉅网

假如你体育课投球10个,进了6个,然后快乐地说,我的射中率比大大都NBA球星要高。那么,祝贺你,你落入了计算学圈套。

先从国外的一所大学下手。假定存在两个学院,一个数理学院一个人文社科学院。

数理学院每年500个申请者,100个女生,400个男生,女申请者有80%的或许被选取,男申请者有75%的或许被选取;人文学院每年200个申请者,160个女生,40个男生,女生有20%的或许被选取,男申请者有15%的或许被选取。

在两个院女申请者被选取率都比男申请者高的情况下,全校选取率男生更高。经过核算咱们不难求出来,这是个现实。

道理很简单,像下面图片相同,全校的男生选取率和女生选取率相当于一个加权均匀,可是男生和女生别离由两个选取率十分不同的集体组成(文科生和理科生),并且这两个集体的份额在男生和女生中十分不同(男生理科生多,女生文科生多),加权均匀的成果会一个更挨近文科选取率、一个更挨近理科选取率。

![宽客网,量化出资,宽客沙龙](v1cdnq.net/file/2010/461lsxmw4ofu1u.png"/>

所以,尽管咱们都觉得美国有色人种的违法率更高,但实际上操控了年纪、爸爸妈妈收入、受教育程度几个变量之后,人种对违法率的影响是不明显的(这是ThomasSowell在blackrednecksandwhiteliberals里边说的),细看黑人和白人的人口结构,其实仅仅黑人里边十五到三十岁这个范围内的人份额更高,而不管人种,都是年纪轻轻还教育缺乏、游手好闲的人违法比较多嘛。黑人最近三五十年一向生育率较白人为高,年轻人所占份额更高,所以全体违法率也会更高。

Stein'sparadox:这个如同不行“根底”。

假定咱们有n个独立的正态分布样本(每个X都是含有许多样本点的sample)

![宽客网,量化出资,宽客沙龙](v1cdnq.net/file/2010/463za55nb034cy.png"/>

当n大于等于3时,假如考虑的是一切n个均值的squarederrorrisk:
![宽客网,量化出资,宽客沙龙](v1cdnq.net/file/2010/464eseqx3uphgb.png"/>

那么有比直观考虑每一维均值的

![宽客网,量化出资,宽客沙龙](v1cdnq.net/file/2010/465t4c5ipz2y12.png"/>

更好的估量量,这个估量量不会像上述计算量那样独自处理每一维度,而是将它们整合起来的如下估量量:

![宽客网,量化出资,宽客沙龙](v1cdnq.net/file/2010/466n54cxtctsg5.png"/>

其间
![宽客网,量化出资,宽客沙龙](v1cdnq.net/file/2010/467tygpzlinzf3.png"/>
是一切样本的均值(grandmean),而
![宽客网,量化出资,宽客沙龙](v1cdnq.net/file/2010/4682pkvkqyap1u.png"/>
是每一个样本的独自均值,c被成为“缩短因子”(shrinkagefactor),它的核算方法如下

![宽客网,量化出资,宽客沙龙](v1cdnq.net/file/2010/469mioroz0304y.png"/>

这个paradox的反直觉之处在于,以上定论在这些X彼此独立的情况下也建立,换一个说人话的比如来说,我想要估量科比、詹姆斯、保罗、杜兰特、安东尼、邓肯这六个人职业生涯投篮射中率这样一个向量,那么,最好的估量量并不是算出这六个人别离出道以来的投篮射中率,而是先把六个人整个的总投篮次数和总射中次数加起来,算一个总均匀,然后每个人别离向自己的那个投篮射中率计算略微挪一点。换句话说,想要一同估量这些人的射中率,那就得在杜兰特的猜测值里边掺上一点科比的数据,才干取得最低的平方差错,即便这两个人自己投自己的,彼此没有什么影响。

Stein'sParadoxinStatistics这篇文章里边用的比如来自于棒球里边冲击率(battingaverage,简化一点便是轮到一个人冲击时他击出安打的概率)的估量作比如,用下图表明直觉的均值估量量和Stein'sestimator的比照


这儿就可以直观地看出shrinkage的意义:每一维度上的估量都向grandmean方向缩短了。在这张图中,尽管咱们的冲击率估量都被改变了,但相对方位没有改变,排名保持不变。

在每一组数据方差彼此不同的情况下,shrinkage实际上或许会导致不同球员之间的次序发生改变。

直觉上其实也很好了解,假如我正巧被某个不明白计算学的教练选中,在无关紧要的竞赛里打了打酱油,5投4中,然后就被裁掉了,我能之后在简历上写上“比杜兰特高29%的射中率”去跟各队要求顶薪吗?因为数据量太少,我的投篮射中率并不是一个关于我的实在篮球水平的好的衡量,所以需求参加其他运动员的均匀数据来加以批改。杜兰特467投238中射中率高于全NBA均值6.2个百分点,比我5投4中射中率高于全NBA均值35.2个百分点,在Stein'sestimator和教练眼里相同,都要值钱得多。

简而言之,取样要满足多并且满足代表性。好歹别一节课手气不错就发生“射中率高于某个球星“的定论,坚持一个学期才是真理。

Via:中财千帆数学社

数模场景搜集开端啦,概况请点击右下角主菜单【∞】挑选场景搜集了解概况,一同聊聊你印象中的数学建模
金融工程,数学算法,射中率,均值

原文发布于宽客论坛,点击阅览原文
猜你喜欢的标签:

“盛楚鉫鉅网-财经,证券,股票,期货,基金,风险,外汇,理财投资门户”的新闻页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与

我们联系删除或处理,客服邮箱,稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同

其观点或证实其内容的真实性。

  • 声音提醒
  • 60秒后自动更新
  • 中国8月CPI年率2.3%,预期2.1%,前值2.1%。中国8月PPI年率4.1%,预期4.0%,前值4.6%。

    08:00
  • 【统计局解读8月CPI:主要受食品价格上涨较多影响】从环比看,CPI上涨0.7%,涨幅比上月扩大0.4个百分点,主要受食品价格上涨较多影响。食品价格上涨2.4%,涨幅比上月扩大2.3个百分点,影响CPI上涨约0.46个百分点。从同比看,CPI上涨2.3%,涨幅比上月扩大0.2个百分点。1-8月平均,CPI上涨2.0%,与1-7月平均涨幅相同,表现出稳定态势。

    08:00
  • 【 统计局:从调查的40个行业大类看,8月价格上涨的有30个 】统计局:从环比看,PPI上涨0.4%,涨幅比上月扩大0.3个百分点。生产资料价格上涨0.5%,涨幅比上月扩大0.4个百分点;生活资料价格上涨0.3%,扩大0.1个百分点。从调查的40个行业大类看,价格上涨的有30个,持平的有4个,下降的有6个。 在主要行业中,涨幅扩大的有黑色金属冶炼和压延加工业,上涨2.1%,比上月扩大1.6个百分点;石油、煤炭及其他燃料加工业,上涨1.7%,扩大0.8个百分点。化学原料和化学制品制造业价格由降转升,上涨0.6%。

    08:00
  • 【日本经济已重回增长轨道】日本政府公布的数据显示,第二季度经济扩张速度明显快于最初估值,因企业在劳动力严重短缺的情况下支出超预期。第二季度日本经济折合成年率增长3.0%,高于1.9%的初步估计。经济数据证实,该全球第三大经济体已重回增长轨道。(华尔街日报)

    08:00
  • 工信部:1-7月我国规模以上互联网和相关服务企业完成业务收入4965亿元,同比增长25.9%。

    08:00
  • 【华泰宏观:通胀短期快速上行风险因素主要在猪价】华泰宏观李超团队点评8月通胀数据称,今年二、三季度全国部分地区的异常天气(霜冻、降雨等)因素触发了粮食、鲜菜和鲜果价格的波动预期,但这些因素对整体通胀影响有限,未来重点关注的通胀风险因素仍然是猪价和油价,短期尤其需要关注生猪疫情的传播情况。中性预测下半年通胀高点可能在+2.5%附近,年底前有望从高点小幅回落。

    08:00
  • 【中国信通院:8月国内市场手机出货量同比环比均下降】中国信通院公布数据显示:2018年8月,国内手机市场出货量3259.5万部,同比下降20.9%,环比下降11.8%,其中智能手机出货量为3044.8万部,同比下降 17.4%; 2018年1-8月,国内手机市场出货量2.66亿部,同比下降17.7%。

    08:00
  • 土耳其第二季度经济同比增长5.2%。

    08:00
  • 乘联会:中国8月份广义乘用车零售销量176万辆,同比减少7.4%。

    08:00
  • 央行连续第十四个交易日不开展逆回购操作,今日无逆回购到期。

    08:00
  • 【黑田东彦:日本央行需要维持宽松政策一段时间】日本央行已经做出调整,以灵活地解决副作用和长期收益率的变化。央行在7月政策会议的决定中明确承诺将利率在更长时间内维持在低水平。(日本静冈新闻)

    08:00
  • 澳洲联储助理主席Bullock:广泛的家庭财务压力并非迫在眉睫,只有少数借贷者发现难以偿还本金和利息贷款。大部分家庭能够偿还债务。

    08:00
  • 【 美联储罗森格伦:9月很可能加息 】美联储罗森格伦:经济表现强劲,未来或需采取“温和紧缩”的政策。美联储若调高对中性利率的预估,从而调升对利率路径的预估,并不会感到意外。

    08:00
  • 美联储罗森格伦:经济表现强劲,未来或需采取“温和紧缩”的政策。美联储若调高对中性利率的预估,从而调升对利率路径的预估,并不会感到意外。

    08:00
  • 美联储罗森格伦:鉴于经济表现强劲,未来或需采取“温和紧缩的”政策。

    08:00

推荐阅读