派客国际投资有限公司??苏文杰
摘要:本文对BitMEX交易所的XBTUSD永续合约的卖4000至买4000的市场深度数据进行统计分析,通过核密度估计得出了大额挂单在不同价格位置出现的概率密度。
大额挂单分为买单和卖单,前者可视为支撑位,后者可视为阻力位,它们对行情走向具有一定的影响。大额挂单的价格可能在限价指令薄的固定位置,也可能在一定的价格范围内移动,可假设其在较大概率上会出现在某些特定的价格位置,从而反映出各个挂单者对行情的判断。
本文对BitMEX交易所的XBTUSD永续合约的卖4000至买4000的市场深度数据进行统计分析,通过核密度估计得出了大额挂单在不同价格位置出现的概率密度。
从获取市场深度数据的时效性来讲,由于获取具有一定的延迟,所有的数据其实都是过去的数据,不一定能代表当前的大额挂单的价格位置,但根据它们在不同价格位置出现的概率密度,我们可以对下一时刻它们可能出现的价格位置做出推断,从而进行相应的策略决策。
比特币鲸鱼数量创历史新高:金色财经报道,比特币鲸鱼数量已达到历史新高。数据显示,截至10月25日,持有至少1000枚BTC的地址数量达2231个。以当前价格计算,1000 BTC约为1300万美元。由此可以推测出,鲸鱼至少控制了223万比特币,这一数字相当于当前供应量的12%。然而根据BitcoinCharts的数据,这些鲸鱼地址实际上控制着7,902,469枚BTC,占总供应量的42%。[2020/10/27]
不同的编程语言一般都有特定的不同的函数来专门运行核密度估计的计算,比较方便,但在实际情况中,为了使程序能够准确反映我们的意图,有必要去深入理解核密度估计的概念。
一、核密度估计-
概率密度函数估计的简要介绍
概率密度函数,常简称为密度函数以至密度,是概率论的最重要概念之一。虽然在统计学上我们常提“总体分布”这个名词,但使用密度的概念去规定或刻画一个统计模型不仅常见,而且比使用分布概念更合适和方便。在各种实际问题中,变量取值的分布呈现“两头小、中间大,左右对称”这种“正态类似型”者为数颇多。这些特点在密度函数的图像上一目了然,而在分布函数的图像上则有不同。
分析师Plan B:比特币与标普500高度相关,有望反弹至1.8万美元:加密分析师Plan B在推特表达对比特币市场走势与标普500指数之间相似性的看法。标普 500指数未来可能会给BTC带来积极的结果。“比特币和标普500是相关的(95% R2)和协整的(所以可能不是虚假的);目前的标普水平意味着BTC将达到18000美元(或者标普将下跌);这与S2FX模型一致:S2F56时,BTC将达到288000美元,这意味着标普将达到4300点;货币印刷(QE)推高标普和BTC。”
Plan B认为,比特币目前的交易价格低于其真实价值,这就是比特币有可能在一段时间内反弹至18000美元“真实”价值的原因。(Zycrypto)[2020/6/18]
密度估计问题,就是要通过从总体中抽得的样本去估计其概率密度函数f。在实际操作中,总可以把问题说成:固定一已知的x轴,要估计f在x点之值f(x)。
如果概率密度函数形状被假定或已知,那么就用参数估计法。如果概率密度函数的形状未知,则用非参数估计法。实际上一般不要求密度函数有某种特定的数学形式,如密度为正态分布之类,也就是说未知密度函数的所属类型并不知道。理由很明显:若密度函数的数学形式已知,而只含少量未知参数,则不如径直考虑这些参数的估计问题,而不提密度估计问题。因此,密度估计问题在本质上说是非参数性的。如今最流行的非参数密度估计法是核密度估计法,也称为Parzen密度估计法。
分析 | 历史数据表明3月至7月比特币价格有可能看涨:数据显示,2019年3月至7月,比特币价格出现大幅上升。过去的记录并不能保证未来的结果,但表明看涨的趋势是可能的。比特币的走势往往是周期性的,有起有落。2019年,期货市场的影响为BTC未来发展增加了注,可能会造成看涨和看跌态度的相互作用。1月3日,数据平台Santiment发推表示,“根据我们的数据,2019年BTC的价格走势与前五年相比如何?从3月到7月,随着比特币飙升到5位数以上,年中价格出现大幅上涨。12月被誉为表现最佳的月份,然而这让许多交易员失望,因为相比2014-2018年12月的平均涨幅(18.7%),这十年结束时价格波动幅度为-31.7%(2019年12月为-13.0%)。”Bitcoinist文章称,基于2019年最后一个季度的总体回落以及1月份触底的预测,增加了对比特币2020年中期看涨周期的希望。(Bitcoinist)[2020/1/4]
核密度估计作为一种非参数统计方法,在近四十余年吸引了不少学术界的注意,通过研究发现核密度估计的方法并非建立在某种艰深的概念或数学工具的基础上,而不过是古老的直方图方法的自然发展,这在统计发展史上有一定的代表性。应当指出的是,密度估计的重要性并不在于它的单独使用,而是作为统计推断的中间环节发挥作用。著名统计学专家Silverman曾指出,概率密度函数估计在数据统计处理的所有阶段都是有用的。
声音 | Willy Woo:未来十年比特币的使用将覆盖全球的50%:加密基金Adaptive Capital合伙人、知名链上分析师Willy Woo在Twitter发文表示,过去的十年将比特币的使用从少数密码朋克带到了全世界的1%。未来十年比特币的使用将覆盖全球的50%。[2020/1/2]
图1
在关于直方图的理论讨论中,我们常假定区间分隔是在考察样本之前就定下来的,因此无随机性,这就使理论简化了。但在实际操作时不一定能恪守这个规定。例如,一批样本可能较集中在O点附近,而在较远的地方的个数较少。这时,有条件把密度f在O点附近之值估计得细一些,而在远处则只能满足于较粗的估计。也就是说,我们可能取一些不等长的区间,区间长度在O附近很短而在远离O点处则较长。然后在每一区间内按式作出f的估计。这时,区间的位置、长短都是在参考了样本以后决定的,故有随机性。这样的直方图估计称为“Data-based”的直方图估计,其理论较a和h都比通常的直方图估计复杂得多,这里就不再讨论了。
声音 | OKEx:比特币明年计划减半导致看涨情绪升温:OKEx最近在一篇博客中指出,比特币挖矿奖励计划在明年减半,看涨情绪由此升温。OKEx表示,投资者开始提前积累,并在牛市需求上升时卖出,这是合乎逻辑的。正如我们在减半开始之前的市场所看到的那样,矿工对hodl(长期持有)的兴趣构成了一个波动性较小的市场,从而使价格稳定并攀升。[2019/9/24]
直方图估计的优点在于简单易行,且在n较大而容许h较小的情况下,所得图像尚能显示密度的基本特征,但也有明显的缺点——它不是连续函数,且从统计角度看效率较低。例如,在这一方法下,每一区间中心部分密度估计较准,而边缘部分则较差。综合种种因素,我们仍可以说:直方图估计不失为一个有用而基本的密度估计方法。
3、Parzen的核估计
不难看出:Rosenblatt估计仍为一个阶梯函数,只不过与直方图估计比起来,各阶梯之长不一定相同而已,仍非连续曲线。另外,从Rosenblatt估计的定义中看出,为估计f在x点之值f(x),对与x在一定距离内的样本,起的作用一样,而在此以外则毫不起作用。直观上可以设想:为估计f(x),与x靠近的样本,所起的作用似应比远离x的样本要大些。这些在Parzen于1962年提出的核估计方法中都得到了体现。
为介绍Parzen的思想,我们先将式变换一个形式,引进一个函数
核函数的举例
以一维情况为例,常用的核函数见下表:
表1
根据上表所示,画出几类核函数的图像如下:
图2
二、比特币期货合约大额挂单的价格位置
不断获取BitMEX交易所的XBTUSD永续合约的卖4000至买4000的市场深度数据,将UTC时间2019-08-0103:49:22时的数据绘图如下所示:
图3
将数据分为卖200至买200、卖800至买800、卖1600至买1600、卖3000至买3000、卖4000至买4000各段,分别求得各段的最大卖价和买价。只不断地保存最近一段时间各段的最大卖价和买价,这可能就是潜在的支撑位和阻力位所在的价格位置。
根据保存的数据,利用核密度估计来计算出各段的支撑位和阻力位所在价格位置的概率密度,概率密度最大处附近即为支撑位或阻力位的所在位置。而各支撑位和阻力位所对应的限价单数量则分别来自于所保存的数据中对应的各限价单数量的中位数。
我们可以分别画出各段的概率密度图,为了方便观察,我们将各图绘制在一起,将阻力位用偏红色的线条表示,将支撑位用偏绿色的线条表示,可得下图:
图4
上图各峰值附近即为大额挂单所形成的支撑位和阻力位,进一步将相关数据列表如下:
表2
从上表可知,各概率密度的峰值虽然不大,但在其邻域进行积分所得到的概率的值较大,因此各概率密度的峰值对应的价格位置附近就是各支撑位和阻力位的价格位置。
此外,各深度的支撑位和阻力位有部分重合。支撑位有两个:价格9750附近,数量约为629.8万张;价格9943附近,数量约为215.4万张;阻力位有两个:价格10080附近,数量约为135.6万张;价格10200附近,数量约为385.5万张。
我们可根据策略需求来选用这些支撑位和阻力位,例如,只将数量600万张以上的视为有效支撑位和阻力位,那么在这段行情就只在价格9750附近存在一个有效支撑位。又如,只将数量1000万张以上的视为有效支撑位和阻力位,那么在这段行情就暂时不存在有效支撑位和阻力位。
三、结论与讨论
本文对BitMEX交易所的XBTUSD永续合约的卖4000至买4000的市场深度数据进行统计分析,通过核密度估计得出了大额挂单在不同价格位置出现的概率密度,从而确定了各支撑位和阻力位的位置。在实际操作中,我们可以根据具体策略选用它们,只将限价单数量达到一定量的价格位置视为有效的支撑位和阻力位。
需要注意的是,比特币期货的波动性很大,支撑位或者阻力位或许只适用于震荡行情中的策略判断,当出现瀑布行情时,巨大的交易量使得它们比较容易被突破。因此,我们往往将其与其他指标一起使用来降低风险。
参考文献
陈希孺,柴根象.非参数统计教程.上海:华东师范大学出版社,1993.247-253
郭照庄.密度核估计中最优窗宽选择的研究.燕山大学硕士学位论文,2006.1-9
张玉敏.基于不同核函数的概率密度函数估计比较研究.河北大学硕士学位论文,2010.8
茹杨.核函数的核密度估计算法.哈尔滨理工大学硕士学位论文,2016.3-5
谢中华.MATLAB统计分析与应用:40个案例分析.第二版.北京:北京航空航天大学出版社,2015.209
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。