文摘
美国股市的最大、最复杂的市场在全球金融体系。在过去的几十年里,这个市场已经在多个结构和时间尺度。新的交流活跃,和其他人停止交易,介绍了法规和改编,技术创新使交易活动的速度极快的速度。这些发展支持丰富的machine-trading生态学的发展导致交易行为的定性差异在人类和机器时间尺度。我们进行纵向分析,综合市场数据量化的非平稳动态在整个系统。我们量化波动之间的关系数量的活跃的交易场所和市场参与者意识到机会成本。我们发现信息不对称的形式报价混乱,预测市场整体波动的指标。最后,我们发现多个micro-to-macro通路水平,包括那些具有自组织临界性的证据。
1。介绍
美国国家市场系统(NMS)是由自适应代理的目标和实现目标的策略1- - - - - -3]。NMS及其各种参与者继续共同进化:交易策略调整,上市公司上市和退市规则变化,证券交易所启动和停止操作。这种共同进化可能产生紧急现象,如泡沫和崩溃(4- - - - - -6]。
我们的研究的动机有两个主要组件。理论部分包括最近的主流金融理论的扩展:从有效市场假说适应性市场假说(1]。市场效率是紧密耦合的各个方面市场生态;竞争对手的数量、频率和幅度的获利机会,和市场参与者的适应性。实证部分包括最近的研究描述泡沫和崩溃(6)和市场效率低下7,8]。核心组件,和我们研究的核心,从信息不对称产生的非平稳动态观察到通过一个全面的订单数据集。
NMS的在许多方面改变了我们的研究期间,跨越了2009年第三季度到2017年第二季度。除了通常观察到资产价格的波动和波动9- - - - - -12),我们表明,报价混乱(7,8显示不稳定行为,与几个市场整体波动的措施。进一步的层次市场的复杂性,NMS基础设施的拓扑结构发生了变化。一开始我们的研究期间,NMS基础设施主要是五十里处位于的卡特里特和Weehawken新泽西。2010年,纽交所搬迁Mahwah交易所数据中心,在2016年,在Weehawken IEX交换开始运营。我们表明,NMS的拓扑变化由NMS参与者与机会成本意识到,即使最迅速波动交易场所执行所有交易相对较小的一部分。
我们简要概述NMS的结构,总结了数字1。NMS是由许多交互组件,包括数据中心、交流、交易员、监管机构、和多层次的规定。数据中心主机的计算基础设施NMS位于新泽西的东北角落。Carteret房屋纳斯达克的家庭交流,Mahwah纽交所的家庭,和斯考克斯市蝙蝠和DirectEdge家庭,而Weehawken是投资者交换(IEX)。交易员旨在减少延迟的NMS连接基础设施常常把他们的交易相同的数据中心中的服务器交流他们经常相互作用。这些数据中心通过沟通渠道建立与最先进的技术,包括光纤、激光器自由空间光学、和毫米波无线。
市场参与者与NMS可以订阅提供的各种数据交换(直接饲料)、证券信息处理器(SIP提要),或一个数据供应商(第三方提要)。直接提供给交易员获得书的信息(例如,引用和贸易信息)、图书信息的深度(例如,添加、修改和取消消息),和行政通知(例如,暂停交易和秩序失衡消息)。口是在交易所市场效用,聚合信息,引入了少量的延迟相对于直接订阅但提供重要的市场信号。口提供的图书信息通过贸易和引用(聚合)喂,全国最好的买入和卖出报价(NBBO;一个重要的市场最好的价格信号)和上限/下限乐队(LULD;一个系统来抑制过度波动)。通过保护要求交易执行价格至少NBBO一样好,给它交易员的重要性超出了一个简单的价格信号。
NMS的结构的核心是国家证券交易所之间的分化,或“点燃”场馆,和另类交易系统(ATS),也被称为“黑暗”场馆,它们由不同的法规和受到不同的报告要求(13]。国家证券交易所要求为SIP提供报价,导致积极参与市场广泛的价格发现过程。美国胸科协会引用在特殊情况(只需要问题13),因此倾向于间接影响价格发现。
数据中心和交流的安排已经相当ns以来动态操作电子交易系统。过渡到电子交易在2005年引发了纳斯达克收购Inet五十里处(最初位于的卡特里特),很快就紧随其后的是纽约证交所收购群岛于2006年(原位于Weehawken)。从那时起,NMS已发展到包括12个ns和大约40 at分布在四个地理位置。出生、死亡、技术故障、意外的市场事件导致交流开关86次在我们的研究期间,通常不包括预定的停机(如节假日)。
我们扩展分析了Tivnan et al。7和环等。8)覆盖超过3000交易符号在一段约8个日历年。我们确定数据提要信息不对称之间的相关性,机会成本与不对称有关,和交易场地波动。尽管其中一些相关性可能相对容易推断,他们让我们不那么直观的结果。指标来源于数据提要信息不对称有正向的预测能力对几个波动的措施。我们还讨论长期趋势的研究数量和影响这些趋势。
2。相关工作
我们的工作旨在量化和NMS市场效率的研究方面。流行的理论是有效市场假说(EMH),由[推广目前的形式14许多包括Bachelier[]和支持15],曼德布洛特[16],萨缪尔森(17]。有效市场假说指出,资产价格反映可用信息,有效市场假说通常有三种形式。有效市场假说的三种形式是有区别的,每个表单信息纳入资产价格。强烈的形式宣称资产价格包含所有公共和私人信息,semistrong形式只考虑公开信息,和弱式只考虑历史价格。无论哪种形式我们检查,有效市场假说之间的连接,超额利润,和随机漫步的定义。如果资产的当前价格已经占一块信息,那么它应该对未来价格没有任何影响。如果信息对未来没有轴承价格,交易基于这些信息不应该提供任何超额回报。
尽管有效市场假说背后的直觉是被广泛接受的,关于它的各种主要出现的反对。几个作品表明,完全有效市场不太可能存在,由于获取的成本和代理相关信息,因此质疑强烈的现实主义形式的有效市场假说(18,19]。理论理由有效市场假说和随机游走模型之间的联系一直有争议,一些工作支持的连接(14,17和其他人反驳它20.,21]。同样,身体的实证研究结果存在冲突。有效市场假说的实证工作支持经常关注市场快速反应信息(事件22- - - - - -26)或开发和应用统计检验的效率(27- - - - - -29日]。相反,许多研究已经发现有证据表明,测试效率间歇性地通过在最好的情况下(30.- - - - - -32)或价格异常出现的持续33,34]。
持续有效市场假说的争论表明,市场效率并不一定是静态属性,导致了替代理论的兴起,如适应性市场假说(抗苗勒氏管激素)35]。发现覆盖效率动力学在新兴市场(36),建立市场37- - - - - -39],interasset变化(40),最近的实证研究在很大程度上支持抗苗勒氏管激素。而不是测试存在或缺乏市场效率,效率的工具,量化方面需要更好地理解提出的动态抗苗勒氏管激素。丁等。41]和Bartlett McCrary [42]研究引用之间的混乱对数据源并提供见解可能普遍存在的信息不对称。哇(43]分析了套利机会,闪亮的光在某些交易策略的潜在利润总额。艾哈迈德和萨切尔(44)开发了一种泡沫检测方法,允许有效interasset比较。戈弗雷(45)研究了基于理想的相对利润衡量效率的被动和主动交易员。
3所示。方法
我们分析数据从Thesys技术(46)包含每条消息从每个SIP和直接输入一个统一的数据格式。组成的∼40 PB的数据,这个数据集覆盖∼2008年至今的交易活动。五十里处Thesys收集这些数据使用硬件托管的卡特里特数据中心和应用s-resolution每个消息的时间戳在收到减轻时钟同步问题。Thesys担任美国证券交易委员会(SEC)的数据提供商的市场信息数据分析系统(MIDAS)直到2019年,当MayStreet收购其部分资产,假设其作为MIDAS数据提供者的角色。
用位错段(DSs)和意识到机会成本与DSs (ROC)相关联,所述Tivnan et al。7和环等。8),我们在NMS编目信息不对称和估计他们的影响。DS是一对数据源之间的信息不对称,是由报价价格差异引起的。我们按照以前的工作在考虑价格显示的SIP NBBO合成直接最好的买入和卖出报价(DBBO)。DS开始在全国最好的价格收购(NBB)或提供(NBO)不匹配其DBBO同行。一个活跃的DS结束如果价格收敛,价格差异的变化(即之间的关系。,NBODBODBONBO反之亦然),或者一个交易日结束。对于每个DS,我们跟踪起始时间、持续时间、最高价格差异,最低价格分歧。DSs独立计算为每个交易的象征,每一方的市场。
交易期间执行的DSs可能带来的机会成本,因为路由和时机的决策可能基于不同细节可用的价格信号。我们量化意识到机会成本(ROC)为每个贸易交易的股票数量总价格区别NBBO和DBBO引用适当的一侧的市场。我们只考虑交易执行价格显示的主流NBBO之一。这提供了一个保守的估计总额的机会成本和专注于交易可能由NBBO通知。
我们的分析涵盖了交易活动从2009年6月1日,5月31日,2017年,所有交易符号,都包含在罗素3000在任何时候。通过覆盖广泛的时间和一个广泛的人口交易的符号,我们的目标是捕获两个纵向和横向的关系。我们关注DSs的关系和证券价格的波动以及波动之间交流与中华民国的数量。我们主要调查直接民国,机会成本发生在交易执行价格显示NBBO和价格是更好的活性比DBBO相应的价格显示的顺序。这些成本可能会经历一个参与者,独家用户直接提要时,不考虑SIP信息交易,或只考虑了流动性。
我们的方法建立和扩展使用的丁等。41],巴特利特和McCrary [42),Tivnan et al。7),环等。8),和(在较小程度上的哇(43]。具体地说,丁等。41]研究类似的报价差异和使用收集的数据来自两个不同的数据源(例如SIP和直接),通过一个单一的数据收集,静态的观察者。我们提倡这种方法使用Bartlett和McCrary42],它只能依赖于SIP数据,因为这种方法避免潜在问题与时间戳同步。虽然我们的位错方法和数据质量非常类似于先前的研究[7,8,41),我们的数据集是几个数量级的范围更大。丁等。41]研究混乱在五24证券交易所和一个SIP 16天的交易。Tivnan et al。7)扩大这个范围考虑混乱和中华民国在13 30证券交易所和两个小口一年的交易。环等。8更进一步,包括混乱和中华民国2900多个证券。在这项研究中,我们的分析包括混乱和中华民国在超过14 3000证券交易所和两个小口跨越八年的交易。扩展这些先前的研究的范围之外,我们还运用新的分析工具,如光谱方法和格兰杰因果,我们细节在下面的部分中。
4所示。结果
NMS的基础设施的变化材料的影响直接观察到民国,图中可以看到2。活动交流范围之间的数量最少 ,最高 在研究期间,共有 波动。场地波动特征的时间序列长期的平稳性与短时间的交错丛发性活动。
我们的模型burstiness指数霍克斯使用一种形式的过程 ,在哪里 。适合场地波动的时间序列时,这个模型的分支比 ,表明如果底层动力学特征准确的模型,86%的场所可能发生波动是内生和另一个场地波动的结果。这种内生性丛发性的行为,再加上一个粉红噪声功率谱密度 ,表明交易场所的动态波动可能是由于自组织临界性(47,48]。之间存在着负相关场所的总百分比within-study活跃的日子和场地波动的次数( )。这种关系只是部分解释为场馆的出生和死亡。多数的波动是由于交投清淡场馆多次打开和关闭在相对较短的时间内没有正式停止操作。中华民国展览似稳谱行为在整个研究期间,见图3功率谱的适应 。然而,中华民国的水平值与活动交易场所的数量负相关( )。这表明中华民国的光谱特征简单的彩色噪声不捕获的全部动力。格兰杰因果分析潜在的因果关系的方向(场馆进行中华民国和中华民国场馆)突出重要和持久的因果关系从场馆到中华民国(场所中华民国)。我们显示时间间隔之间的关系和测试结果的重要性左上角的面板图2。通过展示一系列的测试意义我们避免任意阈值和意想不到的多重比较。此外,图4表明,中华民国发生在不相交的资产组重要的汽车,和互相关在长时间滞后,提供证据的长记忆在中华民国的生成过程除了场地波动。
(一)
(b)
与交易场地波动超出了他们的关系,我们也感兴趣的纵向动态混乱,可以任何时间发生两个或两个以上的交易场所和两个信息提要存在(7]。特别是,我们希望了解普遍的混乱可能会改变随着时间的推移,随着混乱可能的持续时间和严重程度如何发展我们的研究。时间序列和time-decoupled统计这些数据都显示在图5。对于每个交易的象征在学习和每一个交易日 ,我们计算出总数和平均持续时间的混乱。从这些,我们计算预期的位错密度两个指标: 和 。这两个指标显示似稳行为在研究期间( , )。然而,显示季节性行为随着时间的范围研究,展示大山峰交易日毗邻主要的美国联邦假日。Rank-intensity图和 ,按日期(模)和交易的象征,显示在图中6。
(一)
(b)
与波动率统计和有能力预测未来波动。我们获得三种不同的计划——这是VIX波动性指数波动,和30天的中点和转发罗素3000指数的波动(交易象征:RUA)。中点波动在时间被定义为日志回报率的标准差 为 ,而远期波动是相同的测量计算 。对于每个波动性衡量,我们计算皮尔逊和之间的相互关系 ,为所有三个组合找到显著相关( , , )。由于远期波动是没有相关性显著大于零的暗示有能力预测远期波动。边际分布的波动的措施和指标都是适应的对数正态分布的家庭。因此,我们应用SABR模型(49],它假定一个依赖于时间的对数正态分布的波动性和零点漂移参数变化遵循几何布朗运动。下面三个面板图5强调之间的相关性和波动。加上对数正态边际分布,这表明,对具有类似的生成机制。
Quantile-based和位错分布分析时间,如图7,揭示了NMS演化动力学的复杂性超出的时间序列是什么意思混乱持续时间。时间序列的平均位错时间显示相对顺利向低时间衰变,不时被大幅下降可能由于SIP技术升级50,51]。的位错分布分位数持续时间逐渐回落了近一个数量级。相比之下,平均位错分布时间仍几乎constant-expected由于其光谱表征above-while分布位错时间标准差通常在研究期间增加。这些观察表明,“典型”错位越来越短,虽然罕见,发病率的混乱是越来越普遍。
紧急属性,如意识到机会成本和波动性,是由微程序级代理之间的交互。这些操作生成订单,如报价和交易,然后可以用来预测宏观的统计数据。我们主要关注两个micro-to-macro通路,场地波动ROC和位错统计波动。然而,两位错和地点变动统计预测能力ROC和波动。我们适合普通最小二乘模型形式 在哪里是中华民国之一,波动率指数、mid-volatility或波动。所有的变量都是标准化的 。设计变量不同行业和不同的交易价值是衡量控制变量,分别发生在混乱的交易数量和总值(股价由不同数量的股票)交换交易。这些回归总结在表的结果1- - - - - -4。解释方差的比例是高的中华民国( )和波动率指数( )和温和的中期( )和转发( )波动。正如上面详细的,更多的交易场所是降低ROC和波动的统计模型( , 对所有 ),而更多的混乱与更高的中华民国和波动性的统计数据在所有模型( , 对所有 )。平均位错时间显著( )积极的影响在中华民国( )和波动率指数( )但不是在中期( , )和转发( , )波动。这些数据回归分析进行了总结8和9。
(一)
(b)
5。讨论
我们的研究结果表明相干非平稳在美国全美市场系统。系统的拓扑展品点缀着短窗长时间的静态行为的快速波动的活跃的交易场所。这种波动,虽然罕见,但在混乱的效果显著,意识到机会成本。即意识到机会成本减少场馆的数量增加,而增加的数量场馆Granger-causes未来意识到机会成本。
除了拓扑考虑,我们检查位错段纵向的属性。分位数,基于当下的分析分布位错段时间发现免费叙述NMS的演变。分布的25、50和75百分位数错位长度显示near-monotone减少向较低的值,表明市场效率普遍提高。另一方面,平均值和标准偏差的分布位错时间保持近常数在研究期间。结合减少分位数统计信息,这意味着大混乱事件的可能性的增加。
我们调查指标组成的聚合错位统计,与多个措施呈正相关的当前和未来的波动。这些指标也突显季节性影响,包括良好的文档记录违规行为发生在美国假期(52- - - - - -55]。连接地点,ROC和错位,波动分析,我们发现场地波动和混乱统计预测ROC和罗素3000的价格波动最小二乘回归模型。
尽管我们的工作扩展了现有的调查达到了空前的规模,它并非没有限制。下位错段,主要单位研究,只获取一个特定形式的信息不对称,从而获取更大的一部分市场效率的概念。意识到机会成本,这是源自DSs和评估他们的经济影响,可能不会提供一个详尽的估计的经济影响。更准确的测量可能占可用流动性在每个DS和概率估计流动性的交易员是否可以访问。此外,DSs和民国数值有界,这可能使对比数据从不同的资产或时间段。最后,尽管我们的数据让我们调查范围令人印象深刻的横断面和纵向动力学变化,聚合的水平需要总结和显示结果可能面具额外的利益结构。
6。结论
我们总结的三个突出方面贡献来衡量美国全美市场系统的非平稳(NMS)。首先,我们确定预测各种市场措施之间的关系,包括混乱预测未来波动。第二,我们的研究结果提供的证据通过减少位错的持续时间提高市场效率,再加上增加异常混乱的尾部风险。第三,我们发现多个micro-to-macro途径,包括那些具有自组织临界性的证据。
我们的方法,和其局限性,挖掘几个未来工作卓有成效的途径。有机会来改善或扩展的计算和应用位错段,意识到机会成本,正如我们讨论的局限性。相比我们的分析,研究了粗粒度和大规模动态,可能是信息研究位错段的行为和意识到机会成本接近市场异常如闪电崩盘或最近的活动游戏停止。当我们提到几个替代方法量化市场的效率在我们讨论相关工作,这个选择不是详尽的列表。因此,各种定量的比较研究(在)节能措施将使研究人员和政策制定者更深入地理解它们的相对优点。此外,现有的定量(在)节能措施各有局限性,提出新措施的机会,不同的利基市场或包含现有的措施。
而我们的研究结果强调非平稳在NMS在我们的研究中,NMS继续发展。值得注意的是,三个新的国家证券交易所在2020年成为活跃(成员交换(MEMX),长期证券交易所(LTSE)和MIAX珍珠股市(MIAX))。为了更好地理解当前NMS的动态,以及共同进化的适应性如何可能会影响这些动态,我们倡导的额外调查micro-behavior和micro-to-macro机制。原则模型,考虑市场微观结构理论(56- - - - - -58),占代理异质性似乎有前途。数量在这项研究中,观察到混乱,意识到机会成本,连同他们指出各种计量经济学的关系,可以作为下一代的经验目标市场模型。
数据可用性
我们的数据最初由Thesys技术(https://www.thesystech.com/)。一些组件的Thesys已经被MayStreet收购(https://maystreet.com/)。这些数据公开为一个商业产品。
信息披露
剩余所有的观点和错误的唯一责任作者和不反映其附属机构的意见和观点也没有任何资助机构。
的利益冲突
作者宣称没有利益冲突有关这篇文章的出版。
确认
Anshul Anand,作者是感激与詹姆斯•Bagrow大卫•Bringle埃里克•Budish卡尔·伯克,彼得•凯利根比尔•吉布森马修·克勒,Blake LeBaron提示我们马修·麦克马洪马克•菲利普斯马克·罗森塔尔韦德沈,大卫·斯莱特和杰森Veneman乔纳森•史密斯。C.V.O.,J.H.R., D.R.D., and B.F.T. were supported by the Defense Advanced Research Projects Agency (DARPA). C.M.D. was supported in part by a gift from the Massachusetts Mutual Life Insurance Company.