引言和概q?/span>
2023q?span lang="EN-US">3?span lang="EN-US">17日温哥华旉?span lang="EN-US">7点,由温哥华清华校友?x)主办?span lang="EN-US">?/span>清华紫荆讲坛?/span>W三讲正式拉开帷幕。荆讲坛于2021q夏天正式推出,立?span lang="EN-US">?/span>立d立言Q无问西?span lang="EN-US">?/span>的原则,传播学术知识和中西文化,服务校友Q回馈社?x),q同时对校友和公众开放?/span>
本次讲坛主题为“金融投资的未来—h工智能、量化交易和ChatGPT?/span>Q主讲h为清华大学经学院张晓泉教授Q讲座由温哥华清华校友会(x)?x)长何维国主持,清华校友?gu)Z为嘉N访hQ约?span lang="EN-US">350余位清华校友及公众参加。张晓泉教授围绕人工如何应用于投资的历史和现Ӟ量化投资的已知与未知Q以及金融投资未来发展趋势进行了深入探讨。演讲结束之后,听众针对市场预期L动、金融投资从业h员的职场前景{话题展开了热烈的讨论?/span>

主讲人张晓泉教授Q清华大?span lang="EN-US">92U双学士Q英语文学、计机U学双学士)?span lang="EN-US">96U硕士(l济理Q,ȝ理工学院理学博士。清华大学经学?span lang="EN-US">Irwin and Joan Jacobs讲席教授Q国家人才计划讲席教授Q清华大学国际研I生院创新管理研I常务副院ѝ同时担任麻省理工学院数字经研I所(MIT Initiative for Digital Economy)和d国欧z经研I中心(ZEWQ的牚w研究员。他此前是香港中文大学商学院副院长和决策U学与管理经学pȝ讲席教授Q亚太商业研I所(Asia Pacific Institute of Business)的联席执行主任,香港深圳金融研究中心(Hong Kong-Shenzhen Finance Research Centre)的联席主仅R顶U期刊发表的学术论文被引用近万次Q多安U学术期刊的高ȝ。他是超量子量化U募基金创始人,芝加哥量化联盟成员?/span>
为方便读者,我们整理结了张晓泉教授的讲座,结以演讲者的人称撰写Q以带来更好的连贯性和代入感?/span>
AI模型q行量化投资时的底层逻辑
人工在进行量化分析时实际在做q么一件事情——在不确定性中L定性。从U学的角度分析它应该具备可证伪与可复C个特炏V可证伪性是指对于一个事实的陈述Q必d?dng)R辑上的反例存在Q可复现性指ȝ出来的规律,例如太阳恒从东方升vQ能够在未来持箋复现才可被认为是U学的?/span>

q种Ҏ(gu)论指导着我们如何在金融市ZL定性?span lang="EN-US">2020q?span lang="EN-US">2月美股经历了一ơ重大股灾。但其实早在危机前一个月Q我们的模型已经报出了美股可能很快出现危机的预警信号?span lang="EN-US">2020q?span lang="EN-US">1?span lang="EN-US">19日,我在公众号上发表了一文章,持有股的读者可以减仓避险,当然了,如果惛_险的话甚臛_该做I。美股随卛_三月份大q下跌、甚臛_C|见的四ơ熔断。一些朋友后来也告诉我因看了q篇文章才清IZ退休̎户里的美股持仓,所q躲q了q次风险。我们团队由于有模型的信P可以抓住q样的市场机?x)得C非常好的收益?/span>

l大家展CZ下我们当时的模型。图中绿U是股单周收益率。这条线上可以找?span lang="EN-US">1987q?span lang="EN-US">10?span lang="EN-US">19日的股灾Q?span lang="EN-US">2000q的互联|沫,以及2008q的金融危机。这些时间点上的收益率均体现为剧烈下探。橙色线是恐慌指?span lang="EN-US">VIXQ也叫隐含L动率Q是用期权定h型推的。可以看到每ơ隐含L动率向上猛窜的时候,都代表股灾正在发生?/span>
蓝线是我们在自己数学模型里把不合理的假设弱化之后出来的。当蓝线每次从高点迅速穿?span lang="EN-US">0.1水^U时Q股灑֟本上?x)在不久的将来降临。所?span lang="EN-US">2020q初当它下穿0.1临界U时便敲响了一ơ典型的预警?/span>
事实上,我的预测部分Z人工Q另一部分则用了自己的数学模型。这些数学模型是从某个理论出发、不断向下推导得到的。现有的传统金融理论最大的问题在于其假设性过强,强假设所推导出来看似完美的结果,却可能与实际情况非常不相W。因此,我们在开发经金融模型时?x)削弱里头过强的假设Q这h导出来的新指标才能ؓ(f)我们提供更正、有效的信息?/span>
理解基金
大家都知道目前基金分为公募和U募两种cd。公募基金可以公开推广Q对投资者要求门槛较低,但对理人的门槛较高Q需要遵守证券监机构的多项限制Q包括但不限于禁止做I、限制投资标的范围、约束换手频率、需要特定牌照等{?/span>
U募基金则主要面向高净值和机构投资者。它的好处是让管理h在投资策略上享有更大的自LQ可以投多样化标的,采取灉|多样的策略等。费率方面,公募收费相对U募低得多,中国公募的收Ҏ(gu)q_概仅在千分之五,而私募收2%的管理费外加业W报酬。当Ӟ投资者们也会(x)对私募回报率的期望值高许多?/span>
中美股票市场量化投资Ҏ(gu)
中国股票市场现有dD80万亿人民币,不到股市场40万亿元?span lang="EN-US">3成,q且股里的机构交易者占比高?span lang="EN-US">94%Q而中国机构交易者仅?span lang="EN-US">A股的32%。这些机构交易者里国的量化私募规模已过60%Q而中国量化私募的理规模占比仅略高于1%。这些数据都表明中国量化的发展还h极其qK的空间?/span>
量化和主观投资的区别
主观投资cM于巴菲特的那套h(hun)值投资理念,量化投资则利用数据和数学模型q行投资决策。但我想指出的是两者的区别其实没有惌中那么大。同是从股票市场里赚钱,量化和主观的收益均来源于两部分:(x)一?span lang="EN-US">betaQ即大盘本n的上涨下跌。二?span lang="EN-US">Q即能够利用信息差或扑ֈ错误定h(hun)的能力。信息差是指你掌握着他h不知道的信息Q错误定价则是那些巴菲特热爱买入?span lang="EN-US">?/span>被低估的公司?/span>所具备的h(hun)倹{只是与老巴?span lang="EN-US">?/span>长周期持仓、等待h(hun)值回?span lang="EN-US">?/span>的做法不一P量化更善于寻找于未来五天、十天又或是几秒钟的错误定h(hun)?/span>
巴菲特具备很强的投研能力Q可以极为深入地调研某些行业、公司,他的投资{略较ؓ(f)集中Q回报率也很高。但华尔街也有一句话叫做“天下唯一的免费午,是分散风险”,而量化正是采取了分散持仓的方式实现投资回报。巴菲特?span lang="EN-US">30q间取得了高胜率Q但他每q进行交易次数很。在最早期Z也花了很长的旉才判定这是一支优U的管理h团队。量化每q则可能交易Cơ,正因有了q样大量的交易数据,大家能更Ҏ(gu)判断一安化公司是否能够战胜市场,逐步做大?/span>
另一斚wQ胜率ƈ非越高越好,它可能是以极高的风险Zh来的。因此我们需要关注策略的收益来源Q即归因钱是如何被赚到的。我们更不应该盲目追逐那些短期涨得好的股或基金Q因为短期好的策略往往q气成分很大。我们需要了解策略的底层Ҏ(gu)论,q是军_着{略持箋q代的法则?/span>
人工在金融行业的应用
人工目前只能做两件事情,预测和分cR预是通过已有数据扑ֈ规律q得出公式来q行预测Q分cd是通过扑ֈ方程q行ȝ来划分不同的cd?/span>
量化投资是将投资l合的收益率q行拆解Q如无风险收益(定存利率Q、市场收益率、以及未知因素等变量来拟合出最贴近实际市场表现的公式?/span>

在此q想介绍一下我们ȝ的超量子{略金字塔,可见分ؓ(f)四层。我们认扑ֈ全局最优的模型Q需要在最底下两层做优化:(x)W一个是U学层面Q科学研I成本很高,也相当耗时Q但是一旦有H破可能发C片崭新的蓝vQ第二个是艺术层面,所探讨的这一pd问题的成果都应该被加入到模型当中。这些即便是国和中国都很少有团队能发现、有能力解决。我认ؓ(f)U学和艺术层面依然有很大的优化和发展I间?/span>
谈谈ChatGPT和量化的未来
大家LZؓ(f)地希?span lang="EN-US">ChatGPT能生情感、意识,实际上还差得相当q。仔l读q?span lang="EN-US">ChatGPT的白皮书的h׃(x)发现它更多像是语a模型Q而不是思维能力。比如说它可以从幅较长的研报里q行归纳ȝQ帮助投研h员省下很多阅L_(d)但却没有办法像量化擅长的那样做出预测?/span>
我个人思考是ChatGPT能帮忙模拟股数据。数据不够是量化目前一个很大的瓉Q?span lang="EN-US">ChatGPT能有上千亿的参数Q新出的GPT4?span lang="EN-US">100万亿个参敎ͼQƈ且可以生成符合金融规律的数据?/span>
与此同时Q量化投资需要同旉用归Ux和演l法。归Ux是通过观察市场数据Q找到规律ƈ形成假说Q从而得到结论。而演l法则是从理论出发,通过数据观察来验证理论的正确性。当q两U方法结合得好时Q量化投资未来将?x)有一个非常大的发展空间?/span>
最后,分n一个我l常喜欢打的比喻Q金融市场像是大P各种{略好比不同的鱼类。它们都有着各自的生态系l和生存的理由。每U策略赚钱方式不一Pq拥有机器、速度更快׃定可以灭l其它策略,毕竟即便是鲨g不能吃光所有小|但是强鲨鱼可以消灭弱鲨鱼。我所认知的金融市场生态里Q量化跟主观是可以共存的?/span>
部分问答
最后的问答环节非常热烈Q由清华大学l管学院校友Ҏ(gu)Z持,我们选取以下两个h代表性的问题以飨读者:(x)

W一个问题是Q对于金融行业的从业者,人工对于职业路径的选择意味着什么?是更宽广了,q是?x)更加艰难?/span>
张晓泉教授的回答是:(x)人工肯定是拓宽了q个行业的。推荐大家去看一本书Q讲q西蒙斯的《战胜市场的人》。那本书描述了西蒙斯当时是怎么创业Q怎么开始做量化投资。其实他们当时做了非常多的工作,那些基础数据都没有,需要手工地L集数据,自己建构Z套系l去做?/span>
实际上随着人工理论的发展,肯定?x)有更多的工Pq些工具?x)帮助我们更深刻地理解市场,所以肯定是一个好事。反q来Qh工智能以前可能是一个华丽的词,大家?x)觉得我做金融市场,我不需要理解这个东ѝ但是现在大家的p是它是一个必修课了。你不管以前是用什么方法的Q现在h工智能你必须得懂Q不懂你真的从知识结构上?x)被人替代掉?/span>
W二个问题是关于中国量化基金的发展前景。因为目前看来中国国内的公募、私募的量化的用情况还是暂时落后于西方的发展的。?zhn)看未来国内?x)不会(x)在这个行业有更多的个业发展机?x)?/span>
张晓泉教授的回答是:(x)有非常大的机?x)。我q不是觉得中国的机构落后于美国,它只是一个管理规模上的。从{略上讲Q甚至中国有点弯道超车后发优ѝ美国的q套体系很多是做U性多因子模型Q中国一上来Q很多h开始用机器学习(fn)了,所以中国等于一下子跛_了机器学?fn)的时代。但是发展上实是美国的q些量化各自是有一套自qҎ(gu)论的Q中国其实大多数量化比较相近Q相q最大的坏处是在一个大L(fng)生态系l里面都是同一U鱼。首先你是可能找不到很多吃的东西Q你们互相要L同样的东西吃。其ơ,如果得病Q市场出C一些风险,大家都会(x)得同一U病。中国有W一家超q百亿管理规模的量化Q也?span lang="EN-US">2019q的事,所以非常迟。在q去q几q发展非常快Q但是仍然是一个非常初期的阶段。所以我自己的观点,可能未来几年之内?x)重新洗牌,会(x)有一些非常好的这些机构Ş成一个生态圈Q大家有各自的不同的Ҏ(gu)论去形成了一个好的生态系l?/span>
l语
本次讲获得了校友和听众的广泛好评,大家UL(fng)留言Q表辑֯张晓泉教授和温哥华清华校友会(x)的赞赏以及一些徏设性的。我们将以此作ؓ(f)Ȁ励,努力d更好的活动回馈校友和公众。温哥华清华校友?x)感谢各位校友和公众对“清华荆讲坛”的支持Q也感谢长江集团?span lang="EN-US">CHLOE?span lang="EN-US">Aurice TechnologyҎ(gu)友会(x)和讲坛的友情赞助。我们后l还陆l推出其他讲座和zdQ敬请关注。同时敬请关注校友会(x)公众受?/span>
主讲人:(x)清华大学l管学院Irwin and Joan Jacobs教授张晓泉教?/span>
{划+LQ何l国Q清华大?span lang="EN-US">1992U外语系本科Q?span lang="EN-US">1996U法学院研究生)
撰稿Q何清(清华大学2014U经学院)Q何l国Q清华大?span lang="EN-US">1992U外语系本科Q?span lang="EN-US">1996U法学院研究生)
技术支持:(x)薛松Q清华大?span lang="EN-US">1995工物p)、陈思(清华大学2008U法学院Q?/span>
~辑+设计Q肖C斌Q清华大学徏{学?span lang="EN-US">1989U本U?span lang="EN-US">1994U硕士,2003U博士)
采访Q边显hQ清华大?span lang="EN-US">2004U经学院)
dQ王渝(清华大学1986U电(sh)机系Q?/span>
讲dQ温哥华清华校友?/span>