必考知识点,CFA一级数量分析-常见概率分布-下

“人的一切痛苦,本质上都是对自己无能的愤怒。”

文:蓝兔子读难NOTES

图:配图来源于网络

编码:0008

因为篇幅的限制,我们上一篇文章只说了一半,在这一篇文章中,我们会继续进行常见的概率分布内容的分享。可以说,在常见概率分布这一大章内容里面,最重要的内容就在接下来要说的里面,一个是正态分布(normaldistribution),另一个是t分布(student‘st-distribution),其也是掌握后面章节内容的关键知识点。

连续概率分布与正态分布

具体连续概率分布的定义我们在上一篇文章中已经进行过解释,这里就不再赘述。我们直接来看一个连续均匀分布(continuousuniformdistribution)的PDF图形:

MoonPay CEO购买3800万美元豪宅的前几周公司获1.5亿美元融资:金色财经报道,据The Information援引未具名消息来源,包括联合创始人兼首席执行官IvanSoto-Wright在内的MoonPay内部人士在这家加密支付初创公司于2021年11月下旬的A轮融资中获得了1.5亿美元。在2021年的A轮融资中,MoonPay宣布以34亿美元的估值筹集了5.55亿美元,投资方包括Tiger Global Management和Coatue Management。但有些钱并没有流向公司,而是被用来从Soto-Wright等现有股东手中购买股票。

据The Information援引匿名消息人士称,“MoonPay通过向投资者出售股票筹集了4.05亿美元,其余1.5亿美元代表内部人员在二级交易中套现的股票。”据报道,这些内部人士包括Soto-Wright。据报道,MoonPay证实A轮融资包括二次销售,这在之前并未公开。该公司没有立即回应The Block的置评请求。

在A轮融资几周后,Soto-Wright在迈阿密购买了一座价值3800万美元的豪宅,他曾在这处住所举办豪华派对,就像去年巴塞尔艺术节期间举办的派对一样。[2023/5/31 11:48:50]

因为每一个可能的结果发生的概率是相等的,所以其PDF曲线为一条水平线。这里需要强调说明一下,由于连续随机变量可以有无数多个可能,因此针对某一确定的结果,我们近似的认为其发生的概率为0,因此在分析连续随机变量相关问题时,我们应该取区间分析,而不能对点进行分析。

价值约5011万美元的BTC从未知钱包转入Coinbase:金色财经报道,据WhaleAlert数据监测,1814枚BTC(价值约5011万美元)从未知钱包转移到Coinbase。[2023/5/24 15:22:18]

又因为任何一个随机事件,其所有可能的结果的概率和为1,所以上图中,该条直线的y轴坐标为1/(b-a)。当我们对区间(a,b)中任何一段子区间进行分析时,可以利用简单的几何原理算出相应的面积(概率)。

接下来,就是重中之重的正态分布,正态分布几乎存在于我们生活的方方面面,无论是班上同学的考试成绩,还是班上同学的身高体重,基本上都逃离不了正态分布的“上帝诅咒”,而且同一个目标对象的数量(样本量)越是多,越是重复的厉害,那么就越正态。看看下面这两幅图,看看你是否能找到小正态的影子。

请别告诉我这是人为的,即便是人为的,为何偏偏就是这个样子。那到底是哪个样子呢,请看下图:

RoninNetwork:质押超25万枚RON才可运行验证者节点:2月21日消息,Axie Infinity侧链Ronin Network官方宣布,已与社区和当前验证者沟通,此后将需要25万枚RON才能在Ronin网络上运行验证者节点。[2023/2/21 12:18:53]

正态分布虽然如上帝的“祝福”般占据了我们生活的方方面面,但是我们只需要把它当作一个工具即可,一把扳手,我们不需要知道它是怎么生产出来的,我们只需要了解他的一些性质即可:

其PDF完全由均值和方差刻画,通常记为N(均值,方差);其图形对称,偏度为0,越中间概率越大,越两端概率越小;如之前内容所讲,正态分布的峰度为3,超额峰度为0;服从正态分布的随机变量线性组合后还符合正态分布;标准正态分布概率区间几个特殊值经常用要记住,如下图(90%对应1.65个标准差,虽然图中没标,但也很重要)。

接下来的内容是标准化的正态分布。如前文所言,正态分布表示为N(均值,方差),尽管正态分布存在于我们生活的方方面面,但是这方方面面的正态分布却也各不相同,且由于正态分布的PDF比较复杂,我们很难通过表达式去计算出其某区间的概率,更不可能给每一个参数不同的正态分布都列一个表格去查。

法院批准Core Scientific从现有债权人处获得3750万美元破产贷款:12月23日消息,美国比特币矿企Core Scientific周四获得法院批准,从一组现有债权人那里获得3750万美元贷款,为其第11章破产案提供资金。

美国破产法官David Jones在德克萨斯州休斯顿举行的法庭听证会上批准了Core Scientific的临时破产贷款。该公司将寻求贷款的最终批准,并获准在明年1月再借入3750万美元,不过该公司的律师说,它愿意接受其他贷款机构提供的更好的融资方案。(路透社)[2022/12/23 22:02:48]

好在前辈们也纠结过这个问题,并且找到了解决方案:他们把标准正态分布的结果列成一张表,并提供一种把非标准正态分布转换为标准正态分布的办法,再拿这个分布去查表。

标准正态分布表示为N(0,1),其中0为均值,1为方差,任何非标准正态分布都可以进行转换,转换后即可查标准正态分布的表得到相应的值。为了便于理解,举个例子:

已知某公司股票的某参数符合正态分布,其均值为10,方差为9,即服从N(10,9),问随机抽取该股票参数中的某个值,该值小于5的概率,即F(5)。

虽然其服从正态分布,但不是标准正态分布,所以没法直接查表,需要先进行转换,转换的方法就是:

(X-μ)/σ====即=====>>(5-10)/3

Web3短视频平台Cheelee完成800万美元融资,Veligera Capital参投:11月4日消息,Web3视频社交平台Cheelee完成800万美元股权融资,美国投资基金Veligera Capital、阿联酋Infinity Technology Fund、以及VC SILA等参投,该公司还获得了130万美元VC基金拨款支持。

据悉,Cheelee为新用户提供一个免费的“NFT眼镜”,该眼镜可以监测观看视频时间并根据时间长短转换成相应的积分,然后兑换代币奖励。此外,用户也能使用Cheelee的原生代币升级眼镜功能,比如内存、框架、镜片等,目前其服务正处于测试最后阶段,预计会在2022年四季度发布。(techbullion)[2022/11/4 12:16:51]

即查标准正态分布的F((5-10)/3)即可。

查表要注意,1、查表会不会,不会的同学看看书,这里就不解释了;2、查得的是累积概率,可能需要再次进行换算。

标准正态分布也被称为z分布或者u分布。

亏空风险(shortfallrisk):指资产的收益低于最低可接受水平的概率,亏空风险是一个概率。这个最低可接受水平(shortfalllevel)用Rl表示。

罗伊的第一安全比例(Roy'ssafety-firstratio|SFration):

SFRatio=/标准差

从其公式上来看,第一安全比例代表的是每份超额风险所获得的收益,这里的超额指的是投资收益相对于最低要求收益的超额。注意与夏普比率区分,夏普比率的超额是指投资收益相对于无风险收益超额。

同夏普比率一样,每单位风险获得的收益肯定是越多越好,所以怎么根据SFratio选择组合你懂的。

对数正态分布与t分布

接下来是另一个非常重要的分布,学生t分布(studentt-distribution),不要觉得名字奇怪,之所以叫这个名字,只是因为发表的人给自己取了个这么样的笔名而已。就像正态分布也叫高斯分布一样,只是名字而已。

不过说到正态分布和t分布,他们不仅仅是名字都是发表者用的名字而已,他们还有很多的相似之处。怎么个相似法呢,先看图:

我们之前说过,正态分布的样本数量越多,就越正态分布。以考试成绩为例,一个班50个同学的数据肯定没有全校同学的数据那么“正态”。但是如果反过来,班上只有40个同学,或者只有10个同学,他们的成绩还符合正态分布吗?不难想象,当我们数据量越小时,越容易受到极端值的影响,当数据量太少时,就会和正态分布出现偏差。

我们有一位伟大的同学,叫做“Student”,同我们一样,他也发现了这个现象,但是和我们不一样的是,人家找到了小样本的解决方案,后来被命名成t分布。t分布具有如下性质:

图形如上图所示,当自由度增大时,图形逐步接近于正态分布;图形完全由自由度(degreesoffreedom|df)刻画;相比于正态分布,t分布图形有低峰肥尾巴特质,因此峰度>3;这里说明一下,峰态虽然叫做“峰”态,但他看的不是峰有多高,而是尾巴有多肥。

下面是对数正态分布(lognormaldistribution),虽然正态分布占据了我们生活的方方面面,但是他却有一个问题:他的取值范围在正负无穷的范围内,而我们的资产,或者说股票的价格,不可能为负,所以导致其不能用于衡量资产的价格。因此,我们引入了对数正态分布(具体的过程比较有意思,但是这里不说),如下图:

其有如下特点:

非负性,符合资产股票的价格定义域,偏度为正,所以一般用正态分布来衡量资产的风险,而用对数正态分布来衡量资产的价格。

最后还有一个知识点,叫做多元分布(multivariatedistribution),这里大家不用详细了解,只知道多元分布就像多元方程一样,里面有多个元素。考试一般问你需要几个参数才能刻画出这个多元分布,只要记住以下内容就OK:

每一个元需要两个参数来刻画:一个均值,一个方差;每两个元之间需要一个相关系数来刻画,nC2;所以,假设有n元,需要的参数就是2*n+nC2,掏出你的计算器吧!

模拟

模拟就是通过事前对事情进行彩排,来预测和发现事情的发展方向,比如去面试前,你会进行一个模拟面试,考虑会有哪些问题,如何应对。

模拟有两种,以面试为例,很多人都有面试过,自己可能也面试过多次,面试的常见套路,问题基本上就那些,你模拟的时候,你就能知道大概会问哪些问题,虽然每次面试不一样,但是大差不差,你可以假设一种情景来分析,如果问这个问题怎么样,如果问那个问题怎么样。这就是蒙特卡罗模拟(MonteCarlosimulation),我们也称之为情景模拟,对解决如果咋的咋的(whatif)问题很有效。实际上,你就需要先假设这么一个如果(通常假设其符合某一分布),但是其缺陷是,你一旦假设都错了,那你就全盘皆输。而且这种计算费电脑。

还有一个叫做历史模拟(historicalsimulation),就是根据历史数据来模拟,比如搜集某个地方某一天过去100年的天气情况来预测以后的天气情况,由于其依赖历史数据,所以不能进行情景分析,如果(whatif)气象局搞了场人工降雨呢?而且时代在进步,万事万物都是在变,没有什么是一成不变的,所以历史模拟也存在问题。还有就是,你选的这段历史数据万一碰巧选到特殊的一段了,比如模拟经济发展,你刚好选到二战那一段呢?所以,我们通常进行样本外测试(outofsampletest),把数据拿到样本外的历史数据去试试,排除数据选择问题(是那一段时间独有的)。

兔纸的相关文章

CFA一级数量分析-货币的时间价值

CFA一级数量分析-数理统计基础与收益

CFA一级数量分析-概率论基础

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

银河链

[0:15ms0-1:355ms