
更有(yǒu)效的(de)信息聚合方法 ?
發布時(shí)間(jiān):2022-06-16 | ± ♥ 來(lái)源: 川總寫量化(huà)
作(zuò)者:石川
摘要(yào):協變量的(de)高(gāo)維數(shù)時(shí)代,數(shù)不(∑εbù)勝數(shù)的(de)公司特征都(dōuγ"×↕)和(hé)預期收益相(xiàng)關,然≥φπ而它們之間(jiān)存在不(bù)能(néng)忽視(shì)的(♥↕Ωγde)相(xiàng)關性。在這(zhè)個(gè)背景下(♥₽♠xià),如(rú)何更好(hǎo)地(dì)聚合協變 ₩σ量包含的(de)預測信息?
1
對(duì)于資産定價而言,相(xiàng)信到(¥α↔dào)現(xiàn)在你(nǐ)已經接受了(le)協變量的(de≈☆★×)高(gāo)維數(shù)時(shí)代(Kozak,£↕ Nagel and Santosh 2020,Giannone>★σ, Lenza and Primicer£≥←i 2021)。需要(yào)補充背景知(zhī)識的₹ (de)小(xiǎo)夥伴請(qǐng)參考《稀疏性幻覺》。然而,面對(duì)層出不(bù)窮的(de) factor zoo(C₩ ×ochrane 2011,Harvey,α Liu and Zhu 2016)背後的(de)公司∏<∑€特征,一(yī)個(gè)自(zì)然的(de)問(wèn)題✔α£★是(shì):如(rú)何有(yǒu)效地(dì)聚合它們所✔ 包含的(de)預測信息,從(cóng)而形成關于預期收益率更好(hǎo)$₹的(de)預測?
在這(zhè)方面,學界和(hé)業(yè)界的(Ω∑de)嘗試從(cóng)未停止過。比如(rú),最直接的(de)方法是(shì) Fama-MacBוeth regression。當然,一(yī)旦協變量個(↑®↔∑gè)數(shù)激增後,這(zhè)個(gè)方法就(jiù)會(h><γuì)受到(dào)各種計(jì)量經濟學問(wèn)題的(de)§α♥困擾。又(yòu)比如(rú) rank-base<↓★d approach,即根據取值高(gāo)低(dī)将股票(piào)在每個™©δγ(gè)公司特征上(shàng)排名,然後求均值得(de)↑≠ α到(dào)綜合排名。這(zhè)個(gè)方法±∏在 Stambaugh, Yu and Yuan (>2015) 以及 Stambaugh and Yuan (201★☆¶←7) 中大(dà)放(fàng)異彩,也(yě)同時(shíα₽≥)出現(xiàn)在 Asness, Frazzini andγ♦∑σ Pedersen (2019) 的(d•₩e) QMJ 因子(zǐ)構造之中。再比如(rú)各種機(jī)器(qì)學習(xí)算(s☆®αuàn)法,這(zhè)其中以 PCA 為(wèi)代表(Kelly,'∏¥ Pruitt and Su 2019,Kozak, Nagel and φSantosh 2020),也(yě)在聚合預測信息的(de)¥©εφ時(shí)候發揮了(le)很(hěn)大(dλ≥±à)的(de)作(zuò)用(yòng)₩ ✔。另外(wài),Lettau and Pelger (2020a, b)× ♦ 的(de) risk premium δ♥→φPCA 也(yě)是(shì)這(zhè)類方™≠δ£法的(de)拓展。《實證資産定價理(lǐ)論新進展》一(yī)文(wén)的(de)聚合因子(zǐ$≠→≠)信息一(yī)節對(duì)上(shàng)述方•$法有(yǒu)更多(duō)的(de)介紹。
除此之外(wài),Light, Maslov and Ryt®♦chkov (2017) 通(tōng)過将預期收益率視(shì)為(λ♣φ≥wèi)隐性變量(latent variable),利用(yòng) part®¶♦ial least squares(PLS)提出了(le)一(yī)種新的(d↓"↔↑e)方法。該方法實操起來(lái)方便,在直覺上(shàng>>∏✘)也(yě)頗具吸引力。
2
令
由已實現(xiàn)收益率和(hé)預期收益率之間(♥₽§jiān)的(de)關系,我們進而有(yǒu):
對(duì)于進行(xíng)分(fēn)析的( €de)計(jì)量經濟學家(jiā)而言,預期收益率
由于預期收益率是(shì)隐性變量,因此計(jì)量經濟學家(j ¶★iā)的(de)任務就(jiù)變成如(rú)何通(tōng)過可(kě)•φ↔觀測到(dào)的(de)已實現(xià★σn)收益率
The main objective of PLS i☆∞÷♦s the extraction of a common fa≤♦ctor from a set of predictive variabl©∑§es that has the highest covariance wi¥ ₹'th the predicted (target) va§↑ riable. In contrast to PCA and factor α∞analysis, which also extract one •✔or few factors that concisely describeδ♣₽ the variability of data an$₩∏d correlations between predictor >πλs, respectively, PLS identifies a∏♣ε factor with the best ability to prφεedict the target variable even tσ±hough this factor may no★↕t be the most important ™₹πsource of common var™αiation in the predictors.
按照(zhào) Light, Maslov and Rytchkαov (2017) 自(zì)己的(de)話δ♦φ←(huà)說(shuō),PLS 的(de)這(zhè)個(gè)特點正是(↕÷shì)它相(xiàng)比于 PCA 的(α↔≈de)優勢所在。因為(wèi)有(yǒu)些(xiē)公共信息僅僅解釋了₩α(le)特征的(de)共同波動但(dàn)是(s↑↔₩✔hì)卻和(hé)預期收益率無關,這(zhè)些(xiēφ")信息對(duì)于解釋資産的(de)預π≠♠期收益率來(lái)說(shuō)是(s↕ ¥hì)沒有(yǒu)幫助的(de),因此會(huì)影(yǐng)響 β↔PCA 的(de)結果,而 PLS 卻不(bù)會€∏(huì)。為(wèi)此,該文(wén)提出了(le)一(yī)個(gè)兩步截面回$>歸來(lái)估計(jì)預期收益率:
在第一(yī)步中,用(yòng)
值得(de)一(yī)提的(de)是(shì),在∏Ω∑ 上(shàng)述兩步估計(jì)中,第一(yī≥✔)步僅用(yòng)到(dào)了(le)
3
在實證中,該文(wén)選擇了(le)文(w×± ±én)獻中常見(jiàn)的(de) 26 個(gè)公司₩≤特征作(zuò)為(wèi)被聚合的(de)對±∑≥•(duì)象。下(xià)圖展示的(de)就(ji≤β∏ù)是(shì)該文(wén)的(de) portfolio sort>←↕ 結果,其中 Panel A 在估計(jì)
從(cóng)結果中可(kě)見(jiàn):(1)無論等權還(hái)α₩是(shì)市(shì)值加權,以 PLS 得(de)到(dào)的(₹ >de)估計(jì)值構造的(de)對(duì) σ沖組合總能(néng)獲得(de)顯著的(de)超額收益;(2)當使用(y₽™÷®òng)多(duō)期平均來(lái)估計(jì)時£α&(shí),超額收益率無論在經濟上(shàng)還(>±¶hái)是(shì)在統計(jì)上(shàn→ ♦λg)都(dōu)更加顯著。除此之外(wài),通(tōng)過比較信息聚合和(hé)§≥這(zhè) 26 個(gè)單一(yī)變量,作(zuò)者同樣指出兩點¶§×:(1)這(zhè)些(xiē)變量在預測收益率方面确實↓ &存在一(yī)些(xiē)共性,這(zhè)也(y♦÷∏ě)支撐了(le)該文(wén)提出的(de)模型;(2)盡管如($£rú)此,不(bù)同變量仍然包含了(le)關于預期收益率的(de)不(bùΩ)同信息,隻不(bù)過每個(gè)單一(yī)變量都(dōuσ©<♣)是(shì)其所包含預測信息的(de)噪聲版本。
為(wèi)了(le)說(shuō)明(míng) ×∏ PLS 的(de)過人(rén)之處,Light, Ma✘"•§slov and Rytchkov (2017) 将其和(h✔€ε&é)本文(wén)第一(yī)節提到(dào)的(dλ¶e) Fama-MacBeth regression、rank-base♠☆d approach、PCA 以及 factor a∏≠∏δnalysis 進行(xíng)了(le)對(du$↕β<ì)比。後面這(zhè)些(xiē)信息聚合方法的(de¶π)實證結果如(rú)下(xià)表所示。
以構造的(de)對(duì)沖組合超額收益率的(dπ≈e) t-statistics 而論,PLS 方法優于上σλ(shàng)述其他(tā)信息聚合方法,而和(hé) PLS 最接近(jìγ≈n)的(de)要(yào)數(shù) rank-ba↓★±sed approach。就(jiù)這(zhè)÷₽✔個(gè)結果而言,學界和(hé)業(yè)界常用(yòng)的(de) ←δ← rank-based approach♥♥∑♦ 也(yě)是(shì)很(hěn)有(yǒ₽∞¥u)效的(de)方法。
4
本節在 A 股市(shì)場(chǎng)對(duì)上(shàng)述 PL∞∑•S 方法進行(xíng)實證,看(kàn)看(kànδ£γ)和(hé)人(rén)們更熟悉的(de) rank-basλε☆↕ed approach 相(xiàng)比結果如↑±(rú)何。實證中使用(yòng) BetaPlus 小(xiǎo)組在《一(yī)個(gè)混合四因子(zǐ)模型》一(yī)文(wén)中介紹的(de)十個(g☆₩¥ è)協變量,它們包括賬面市(shì)值比(BM)、短(du♠®α×ǎn)期反轉、特質波動率、MAX、異常換手率、SUE、ROA®&、應計(jì)量、動量以及流動性沖擊。計(jì)算Ω↔(suàn)說(shuō)明(míng)見(ji λ àn)下(xià)表。數(shù)據窗(chuā $βΩng)口橫跨 2000 年(nián) 1 月(yuè) 1 ₽£日(rì)至 2022 年(nián) 5 月(yuè) 31 日(r☆•ì)。
對(duì)于 PLS 來(lái)說(shuō),首先每月(yuè)對(∏↔'$duì)每個(gè)指标在截面上(shàng)進行(xí© £ng)标準化(huà)(具體(tǐ)數(shù)'γβ據處理(lǐ)方法請(qǐng)參考《因子(zǐ)投資:方法與實踐》的(de) 3.1 節),然後采用(yòng)≈前文(wén)介紹的(de)兩步回歸法,估計(jì)每個(gè§)月(yuè)每支股票(piào)的(de)預期★$收益率,并以估計(jì)值的(de)高(gāo)低(dī)作(zuò)>¥ε為(wèi)分(fēn)組排序的(de)依據。在實證中≤β★π,在兩步法的(de)第二步中,對(duì)于
觀察上(shàng)述結果,可(kě)以總結出兩♥✔點:(1)由于估計(jì)誤差,使用(yòng)當期
和(hé) Light, Maslov and Rytchkov (201≤∏£≤7) 一(yī)文(wén)基于美(měi)股的(de)結果相(xiàng)比☆ ♦,在業(yè)界更常用(yòng)的(dα♠§φe) z-score 均值面前,PLS 兩步βσβ法似乎并沒有(yǒu)什(shén)麽過人(rén)β↑之處。但(dàn)是(shì),我們也(yě)不(σ±bù)應僅僅基于以上(shàng)有(yǒu)限的(de)結果就(ji¶β←ù)那(nà)麽快(kuài)對(duì) PLS 方法在 A 股的(d✘★πe)表現(xiàn)下(xià)定論。今後可(kě)以通(tōng§ )過更多(duō)的(de)穩健性分(fēn)析來≤σ(lái)考察其能(néng)夠發揮的(de)作(zuò)用¥₽(yòng)。
5
在協變量的(de)高(gāo)維數(shù)時(shí)$↑代,如(rú)何聚合不(bù)同變量涵蓋的(de)預測信息是(shì)非常≥®π 重要(yào)的(de)課題。在這(zhè)方∞ ≥面,研究的(de)思路(lù)應著(zhδσ&"e)眼于剖析并有(yǒu)效利用(yòng)不('×bù)同變量所涵蓋的(de)共有(yǒu)信息、每個(gè)•£₽變量所攜帶的(de)獨有(yǒu)信息,以及剔除每個(g♦$≈è)變量所涵蓋的(de)巨大(dà)的(de)噪聲。Lig&•∑ht, Maslov and Rytchkov (&↔∑2017) 為(wèi)此提供了(le)有(yǒu₩∏∏)益的(de)思路(lù)。
然而,我們對(duì)信息聚合的(de)追求Ω 并不(bù)能(néng)止步于此。信息聚合的(de)目标是(shì)為(wèi)了(le£π±σ)獲得(de)更加準确的(de)估計(jì),因此無論是(shì)采用∞☆(yòng)前文(wén)介紹的(de)Ωδ↑ PLS 還(hái)是(shì)其他(tā)方法(盡管這(zhè)♣¥"些(xiē)方法的(de)效果有(yǒu)所差異),聚合後的(de)變±✘σ♥量較單變量來(lái)說(shuō)都(dōu)會(huì)獲得(de)≈✘™↓更加顯著的(de)超額收益。然而,這(zhè)後面↓ ★一(yī)個(gè)巨大(dà)的(de)但(dàn)卻往往被人(ré© ±&n)們忽視(shì)的(de)假設是(shì),被用(♣∞yòng)來(lái)信息聚合的(de)單變量都(dōu)是(shì)真¶→ ≈實的(de)。可(kě)是(shì),如(rú)果某些(xiē)或絕大≥≠♥(dà)部分(fēn)協變量和(hé)預期收益率之間(ji♣γ↔λān)的(de)關系是(shì)虛假的(de)(p-hacking),那(nà)麽聚合之後又(yòu)會(huì)±σ如(rú)何呢(ne)?是(shì)否會(huì)“錯(cuò)上(σshàng)加錯(cuò)”呢(ne)?如(rú)果是"↑✔±(shì)的(de)話(huà),又(yòu)是(shì)否有(yǒu)什(s€★§hén)麽更好(hǎo)的(de)辦法來(↔lái)降低(dī)聚合的(de)危害嗎(ma)?
我們擇日(rì)再議(yì)。
(Hint:對(duì)于這(zhè)個(gè)問(w↕èn)題,Rytchkov and Zhong (20φ↔$20) 給出了(le)答(dá)案。)
參考文(wén)獻
Asness, C. S., A. Frazzini™ €", and L. H. Pedersen (2019). Ω®>Quality minus junk. Review of Accounting ₩✘ Studies 24(1), 34 – 112.
Cochrane, J. H. (2011). Presidentia☆γ¶l address: Discount rates. Journal of Finance 66(4), 1047 – 1108.
Giannone, D., M. Lenza, and G. E. P®rimiceri (2021). Economic £λpredictions with big data: The illusio§π ∑n of sparsity. Econometrica 89(5), 2409 – 2437.
Harvey, C. R., Y. Liu, anα←≠d H. Zhu (2016). … and the cross-sect☆♥₩'ion of expected returns. Review of Financial Studies 29(1), 5 – 68.
Kelly, B. T., S. Prui♠γδ₩tt, and Y. Su (2019)¥±. Characteristics are covariances: A ∏φunified model of risk and>£₹ return. Journal of Financial Economics 134(3), 501 – 524.
Kozak, S., S. Nagel, and S. Santosh ∏©₩(2020). Shrinking the cross♣δ♠ -section. Journal of Financial Economics 135(2), 271 – 292.
Lettau, M. and M. Pelger (20♠∏"20a). Factors that fit the t•©α♦ime series and cross< -section of stocks returns. Review of Financial Stud£•ies 33(5), 2274 – 2325.
Lettau, M. and M. Pelger (2020™©₩b). Estimating latent asse&↔☆t-pricing factors.Journal of Econometrics 218(1), 1 – 31.
Light, N., D. Maslov, and O. Ryt≤₽♦chkov (2017). Aggregation of infoλ≥βrmation about the cross section of↓≤& stock returns: A latent $✔γvariable approach. Review of Financial Studieλε•♥s 30(4), 1339 – 1381.
Rytchkov, O. and X. Zhong (202☆∏0). Information aggregation and p-δ$☆$hacking. Management Science 66(4), 1605 – 1626.
Stambaugh, R. F., J. Yu, and&δ↓ Y. Yuan (2015). Arbitrage asymme£$ 'try and the idiosyncr↑ ≤±atic volatility puzzle. Journal of Finance 70(5), 1903 – 1948.
Stambaugh, R. F. and Y. Yuan (2017). M☆≤•≈ispricing Factors. Review of Financial Studies<↑★ 30(4), 1270 – 1315.
免責聲明(míng):入市(shì)有(yǒu)風(fēng)險,投ασ資需謹慎。在任何情況下(xià),本文(wén)的(de)內(nββèi)容、信息及數(shù)據或所表述的(de)意見(jià'™©n)并不(bù)構成對(duì)任何人(rén)的(de☆ )投資建議(yì)。在任何情況下(xià),本文(wén)© ≠•作(zuò)者及所屬機(jī)構不(bù)對(duì)任何人(rγ•×¶én)因使用(yòng)本文(wén)的(de)任何內®¥(nèi)容所引緻的(de)任何損失負任何責任。 ∞& 除特别說(shuō)明(míng)外(wΩ©£ài),文(wén)中圖表均直接或間(jiānαββα)接來(lái)自(zì)于相(xiàng)應論•'♦ 文(wén),僅為(wèi)介紹之用(yòng),版權歸原作(z ♦uò)者和(hé)期刊所有(yǒu)。