
多(duō)重假設檢驗的(de)源起、中興₹→≈→和(hé)未來(lái)
發布時(shí)間(jiān):2024-04-17 | ✔¶δ 來(lái)源: 川總寫量化(huà)
作(zuò)者:石川
摘要(yào):實證資産定價中,多(duō)重假設檢驗容易造成樣本內(nèi)的(de)僞π'發現(xiàn)。本文(wén)帶你(nǐ)了(le)解多(duō)重假設↕×λ檢驗的(de)源起,中興和(hé)未來(lái)。
1 源起
多(duō)重假設檢驗(multiple hyγpothesis testing)指的(de)是(shì)同時(shí<≥)檢驗多(duō)個(gè)原假設。在實證資産定價中,使用(y₽ òng)曆史數(shù)據挖掘成百上(shàng)千個(gè)因子(zǐ)正®ε≥ε是(shì)多(duō)重假設檢驗。當同時(shí)檢驗多(duō)♠§>個(gè)假設時(shí),運氣成分(fēn)&$γ'(噪聲)會(huì)導緻單個(gè)原假設檢驗結果的(de)顯著性被高(gā&✘✔o)估。當排除了(le)運氣成分(fēn)後,原假設可(kě)能(né≥★♥ng)不(bù)再顯著。
在單一(yī)假設檢驗中,通(tōng)常以€π÷★ 0.05 作(zuò)為(wèi) p-value 的(de)阈值來(lε↓ái)判斷是(shì)否接受原假設,其對(du"&™&ì)應的(de) t-statistic 為(wèεεi) 2.0。這(zhè)也(yě)早已成為(wè↓α₩i)實證資産定價中挖因子(zǐ)的(de)依據。然而®∞多(duō)重假設檢驗的(de)存在使得(de)λ∏¥低(dī) p-value 無法準确說(shuō)明(míng)因子(zǐ)是 γ"®(shì)否有(yǒu)效。假設我們同時(sh₽ε↕♣í)檢驗 100 個(gè)獨立的(de)因子(zǐ)并發現(xiàn)某λ♥→個(gè)因子(zǐ)的(de) t-statiΩ≥↕stic = 2.0。在這(zhè)種情況下←Ω(xià),我們不(bù)能(néng)₽≤說(shuō)該因子(zǐ)在 0.05 的(de)顯著性水(shuǐ)平↓• 下(xià)顯著。這(zhè)是(shì ↓←$)因為(wèi)哪怕這(zhè) 100<×₽$ 個(gè)原假設都(dōu)為(wèi)真(即它們&的(de)超額收益都(dōu)為(wèi)零),那(nà)麽僅≈±僅靠運氣,其中出現(xiàn) t-stat↔×istic 大(dà)于 2.0 的(de)概率高γ&(gāo)達 99%。如(rú)果仍然按照(zhà≠ ∑∑o)傳統意義上(shàng)的(de) 2.0 ₽∞作(zuò)為(wèi) t-statistic 的(de)阈值來(l≠π'ái)評價因子(zǐ)是(shì)否顯著,注定會(huì)有(y∞βǒu)很(hěn)多(duō)僞發現(xiàn)(false discove≤$ries 或 false rejections),γ©即第 I 類錯(cuò)誤。因此,正确處理(lǐ)多(duō)重假設檢驗的(ε₽de)影(yǐng)響成為(wèi)實證資産定價的(de)>→ 關鍵。
在這(zhè)方面,學術(shù)界的(de)δ>©←研究成果可(kě)以被劃分(fēn)為(♣♣$wèi)兩大(dà)類,即頻(pín)率主α義方法和(hé)貝葉斯方法。為(wèi)了(le)排除φγ≠ 運氣(噪聲)的(de)影(yǐng)響,頻≠$&↓(pín)率主義方法以控制(zhì)第 I ♣±類錯(cuò)誤為(wèi)目标,通(tōng↓♦π♣)過增大(dà)标準誤(standard errors)來(lái)修正單個(gè)因子(zǐ)的Ω (de)顯著性水(shuǐ)平。直覺上(shàng)說(shuō),增✔®≈α大(dà)标準誤意味著(zhe)增大(dà ✘δγ)置信區(qū)間(jiān),因而這(zhγ©♣è)使得(de)單個(gè)檢驗的(de)顯著性門(mén)檻更加嚴格:隻&≤有(yǒu)當一(yī)個(gè)因子(zǐ₹)原始的(de) t-statistic (遠(yuǎn))超過傳統意義上✘λπ(shàng)的(de) 2.0 水(shuǐ)✘<↕平,其才有(yǒu)可(kě)能(néng)在被修正後依§± ¶然顯著。
早期的(de)方法多(duō)屬于頻(pín)率主義☆✔方法,目标是(shì)控制(zhì)第 I 類錯(cuò)誤。在統計(jì¶♣♥₩)學中,族錯(cuò)誤率(family-wise error ra↔te,簡稱 FWER)、僞發現(xiàn)率(false disc π↓★overy rate,簡稱 FDR)以及僞發現(xiàn≥₹)比例(false discovery prop← πortion,簡稱 FDP)是(shì)常見(jiàn)的φπ®(de)第 I 類錯(cuò)誤指标。讓我借助下(xià)&εβ表來(lái)解釋它們。
假如(rú)一(yī)共有(yǒu)
族錯(cuò)誤率 FWER 定義為(wèi≈♦✔)出現(xiàn)至少(shǎo)一(yī)個(gè)僞發現(xiàn)∏×∏的(de)概率,即
其中
其中
近(jìn)年(nián)來(lái),還(hái)有(yǒu)一(yī)些"≥(xiē)以控制(zhì)族錯(cuò)誤率為(wèi)目标的≤♣×(de)算(suàn)法被提出,包括 Whit'≠£∏e (2000) 的(de) bootstraπ™p reality check 方法和(hé) Romanoσ≤× and Wolf (2005, 2007) 的(de) Step♥✔±αM、k-StepM 方法等。這(zhè)三種算(suà©§ n)法均通(tōng)過自(zì)助法(bootst✘•∑αrap)對(duì)因子(zǐ)收益率數(shù)據進行(xíng)♥✘重采樣,并在此基礎上(shàng)結合正交化(huà)≥求出 t-statistic 的(de)阈值,因<≥而無需對(duì)數(shù)據的(de©↕←✔)分(fēn)布做(zuò)任何假設。
在上(shàng)述描述中,正交化(huà)和(hé)自≥δλ(zì)助法兩個(gè)詞反映了(le)這(zhè)些(x¥¶ iē)算(suàn)法以及頻(pín)率主義方法的(de∑φπ)核心。正交化(huà)的(de)作(zuò)用(yòng)是(shì∑α)消除因子(zǐ)在樣本內(nèi)的(de)收益率均值,使因子( ÷₹zǐ)收益率在時(shí)序上(shàng)成為(wèi)均值為(wèi)$™零的(de)随機(jī)擾動;自(zì)助法的(de)作(zuò&≠)用(yòng)是(shì)通(tōng)過 對(duì)正交化(huà)後的(de)收益率₹π™進行(xíng)采樣從(cóng)而得(de)到(σ₩♣ dào)僅靠運氣成分(fēn)而造成的(¶>de)檢驗統計(jì)量的(de)分(fēn)布,以此就(jiγ$€ù)可(kě)以判斷原始因子(zǐ)的(de)顯著性是(♣<<shì)真實的(de)還(hái)是(shì)僅僅是(shì)噪₽§±ε聲造成的(de)。值得(de)一(yī)提的(de)是(sh쥙☆),由于太過嚴苛,以控制(zhì)族錯(cuò)誤率為(wèi)目标并不(b' ↓ù)是(shì)很(hěn)适合金(jīn)融領域。
僞發現(xiàn)率 FDR 的(de)定義為(wèi)
最後,控制(zhì)僞發現(xiàn)比例 FDP 的(de)目标是( ≤εshì)限制(zhì)
2 中興
近(jìn)年(nián)來(lái),學術(shù)界越來(lái)越重視(•δ★shì)多(duō)重假設檢驗問(wèn)題對(duì)因子(zǐ)顯著性的($↔de)影(yǐng)響,在這(zhè)方面也(yě)誕生(shēng)了(§♥→♣le)很(hěn)多(duō)優秀的(de)研究成果。在介紹這(zhè)些ε<(xiē)研究成果之前,讓我們先來(lái)簡要(yào)回顧一¥λα(yī)下(xià)相(xiàng)關的(de)背景。↔∑
2017 年(nián),時(shí)任美(měi)國(guó)金(jīπ©n)融協會(huì)(AFA)主席 Campb'↔★σell Harvey 教授在年(nián)會≤λ '(huì)上(shàng)以 The Scientific Outlook in Financ'↔∏ial Economics 為(wèi)題進行(xíng)了(le)主席演講。以一(yī)個(gè)學€♠→γ者應有(yǒu)的(de)科(kē)學态度和(hé)操守,ε$αHarvey 教授深刻剖析了(le)近(jìn)年(niá©↔♥n)來(lái)學術(shù)界在實證資産定價研究♠中的(de)一(yī)個(gè)錯(cuò)誤趨勢。為(wèi)了®Ω(le)競逐在頂級期刊上(shàng)發表δ↕∏文(wén)章(zhāng),學者們通(tōng)過各種數(shù)據窺探φΩ手段過度追求因子(zǐ)的(de)低(dī) p-γ×♠±value(即 p-hacking)。由于有(yǒu)意←π$或無意的(de)數(shù)據操縱、使用(yòng)不(bù)嚴謹的(deγ↓§≥)統計(jì)檢驗手段、錯(cuò)誤地(dì)理(l™γǐ)解 p-value 的(de)含義、以及忽視≥<(shì)因子(zǐ)的(de)內(nèi)在'βπ經濟學邏輯,很(hěn)多(duō)在功利心驅使 ₽™下(xià)被創造出來(lái)的(de)因子(zǐ)在實際投¥≤資中根本站(zhàn)不(bù)住腳(McLean and Pontiff≈ 2016)。此外(wài),發源于因子(zǐ)投資、在業(β∞yè)界早已成為(wèi)主流的(de) S"≤↑mart Beta ETF 基金(jīn)也(yě)飽受 p-hac≤→↓king 問(wèn)題困擾。Huang, Song and Xiang ( π ✘forthcoming) 記錄了(le)δ這(zhè)類基金(jīn)被推出後其表現(xiàn∏×>)相(xiàng)較于其樣本內(nèi)表現♠ (xiàn)急劇(jù)下(xià)滑的(de)實證發現(xiàn),并指出↑過度的(de)數(shù)據挖掘是(shì)這(zhè)背後↔∏的(de)罪魁禍首。
要(yào)論為(wèi)學術(shù)界敲響多(duō)重假設檢≤✘¶±驗警鐘(zhōng)的(de)代表性論文(wén)'→,Harvey, Liu and Zhu (201♠♥ 6) 當仁不(bù)讓。該文(wén)研究了(le)學術(sh←÷≤×ù)界發表的(de) 316 個(gè)因子(zǐ)。以控制(z↔®hì)僞發現(xiàn)率為(wèi)目标,該文(wén)發現(←βxiàn)隻有(yǒu)一(yī)個(gè)因子≤÷©×(zǐ)原始 t-statistic 超→φ 過 3.0 時(shí),其才在排除多(duō)重假設檢驗的(de)影(y↓©¥ǐng)響後依然是(shì)有(yǒu)效的(de)☆∑"。除此之外(wài),該文(wén)指出在全部三百多(duō)個(gè)₹<因子(zǐ)中,僞發現(xiàn)的(de)比例高(gāo)達λ≤π↔ 27%。
在試圖消除多(duō)重假設檢驗的(de)影(yǐng∏♠≠)響時(shí),除了(le)選擇合适的(de)統計(jì)手段外(wài∑$φ),另一(yī)個(gè)必須面對(duì)的(de)問(wèn)ε↕題是(shì)到(dào)底有(yǒu)多(duō)少(shǎo)個(gè)原假設被同§•✔時(shí)檢驗(即有(yǒu)多(duō)少(shǎo)'Ω因子(zǐ)被挖出)。這(zhè)個(gè)問επ¶÷(wèn)題之所以重要(yào),是(shì)因為(wèi)"¶基數(shù)決定了(le)運氣的(de)多(duō)寡。比如(rú),檢↑£$驗 100 個(gè)和(hé) 10000 個(gè)因子(zǐ)£§★相(xiàng)比,萬裡(lǐ)挑一(yī)的(de)肯定要(yào)比 ≥÷₹百裡(lǐ)挑一(yī)的(de)更顯著。所以,β≠隻有(yǒu)知(zhī)道(dào)學術(shù)界到☆₹¥∞(dào)底挖了(le)多(duō)少(ε÷shǎo)因子(zǐ),才有(yǒu)可(kě)能(néng)準确修正多(du×σ∑&ō)重假設檢驗問(wèn)題。
看(kàn)到(dào)這(zhè)裡(lǐ),有(yǒ©☆σ♠u)的(de)讀(dú)者可(kě)能(néng)會(∞huì)問(wèn),Harvey, Liu and Zhu (2♦016) 考慮了(le) 300 多(duō)個(g÷↔β♥è)因子(zǐ)、Hou, Xue and Zhang (2020) 複現(x♣φiàn)了(le) 450 個(gè)左右因子(zǐ)±φ,它們是(shì)否就(jiù)是(shì)學術(shù)界挖掘的(de)β★£₹全部呢(ne)?不(bù)幸的(de)是(shì),答(dá)案是(s₹÷♥♥hì)否定的(de)。因為(wèi)這(♦δzhè)些(xiē)僅僅是(shì)被發表出來(lái)的(de)因子(♣≠↑ zǐ),而學術(shù)界在這(zhè)背後到(dào)底嘗試了(le)額外(Ω>wài)多(duō)少(shǎo)因子(zǐ)是(shì)無從(cóng)☆而知(zhī)的(de)。由于已發表的(de)因子(zǐ)是(≈≥εshì)所有(yǒu)被研究因子(zǐ)的(de)子(zǐ)集β☆ ≈,因此我們可(kě)以判斷 Harvey, Liuαγ♥δ and Zhu (2016) 發現(xiàn♦↔)的(de) 3.0 阈值僅僅是(shì αλ∑)保守估計(jì)。幸運的(de)是(sh≠∞ì),Chordia, Goyal and Sar•÷÷☆etto (2020) 創造性使用(yòng)模拟推斷出基于研究的(♥>de)因子(zǐ)集的(de)統計(jì)特征如(✘♦rú)何消除多(duō)重假設檢驗的(de)影(yǐng'™)響。該文(wén)将 t-statist✘δ∞ic 的(de)阈值進一(yī)步提升至 3.4 以♦♦β上(shàng),且模拟計(jì)算(suàn)顯示,僞↓∑•發現(xiàn)比例高(gāo)達 45.≈σ3%。
頻(pín)率主義方法依賴于引入衡量評價α&↔'多(duō)個(gè)假設整體(tǐ)第 I 類錯(cuò)誤的(de)™♠ £指标(例如(rú)族錯(cuò)誤率或僞發現(xiàn)率φ<),并以此為(wèi)目标調整單一(yī)假設檢驗的(d™¥ e)顯著性。與頻(pín)率主義方法相(xiàng)←↑∑對(duì)應的(de),是(shì)貝葉斯方法。貝葉斯方法允許人(rén)們引入從(cóng)經濟學理(lǐ)論得(de)∑'β出的(de)關于因子(zǐ)是(shì)否為(wèiδ✘)真的(de)先驗。但(dàn)缺點是(shì)完 ✔λ¶整的(de)貝葉斯框架計(jì)算(suीn)十分(fēn)複雜(zá),因此人(¥₹rén)們有(yǒu)時(shí)不(bù)得(de)不(λ←™₩bù)做(zuò)出一(yī)些(xiē©✔ )妥協和(hé)簡化(huà)。
Scott and Berger (2006) 在貝葉斯框架下(x₩≈ià)提出了(le)研究因子(zǐ)收益率的(de)一(yī↓<✔∏)個(gè)三層模型。利用(yòng)該∞₩≥模型,人(rén)們可(kě)以計(jì)算(suàn)出₹✔每個(gè)因子(zǐ)為(wèi)真的(de)後驗概率。随著(zhe)同時(shí)檢驗的(de)假¥☆δ"設個(gè)數(shù)(即因子(zǐ)個(gè)數(ε↔$↔shù))的(de)增加,後驗概率将更加接近(jìn) 0。換句話&εφ(huà)說(shuō),随著(zhe)噪聲信号(虛假因子(zǐ))個(×$gè)數(shù)的(de)增多(duō),真實因子(zǐ)α×>β傳遞出來(lái)的(de)證據也(yě)會(huì)随之而降低(dī),β♦這(zhè)體(tǐ)現(xiàn)出和(hé)頻(p≠ "ín)率主義方法相(xiàng)對(duì)應的(de)對(dλ$•®uì)多(duō)重假設檢驗的(de)懲罰。這(zhè)正是(shì)貝葉斯↔Ω★≤框架自(zì)帶奧卡姆剃刀(dāo)效應,即根據同時(shí)被檢∞↔£驗的(de)因子(zǐ)的(de)個(gè)數♠↑÷α(shù)自(zì)動調整因子(zǐ)為(wèi)真≈♣的(de)後驗概率的(de)原因。
雖然完整的(de)貝葉斯框架理(lǐ)論完整,但(&λdàn)實操起來(lái)也(yě)有(yǒu)很(hěn)多(du'±ō)問(wèn)題。例如(rú)它的(de)₩♥假設(尤其條件(jiàn)獨立性方面的(de)假設)太過苛刻,且在計(jì)算 π¥✘(suàn)方面,當同時(shí)考慮的(de)因子(zǐ)個(gè)數(€<shù)很(hěn)多(duō)時(shí),計(jì₽®")算(suàn)每個(gè)因子(zǐ)為(wèi)真的★←♣₩(de)後驗概率極具挑戰。第三,即便得(de)到(dà✘γ♥®o)了(le)每個(gè)因子(zǐ)為(wèi)真的(d >e)後驗概率,我們依然需要(yào)構建一(yī)↔↕≈≤個(gè)判斷準則,即後驗概率高(gāo)于多←λ♦(duō)少(shǎo)阈值的(de)因子(zǐ) ≈§可(kě)以被視(shì)為(wèi)真€ π<。然而在這(zhè)方面,目前還(hái)沒有(yǒu)太多(÷★←duō)指導。
鑒于完整貝葉斯框架的(de)實踐應用(yòng)充滿挑戰,人(rén)'π£≤們便希望退而求其次通(tōng)過别的(de)方式利±∞☆↔用(yòng)貝葉斯思想。在這(zhè)方面,Harvey (2017) 提出了(le)最小(xiǎo)貝葉斯因子(z§&↔ǐ),并通(tōng)過它計(jì)算(suàn♥×✘)貝葉斯後驗 p-value 進而判斷因子(zǐ)是(shì)否顯著。為♠©(wèi)了(le)讓各位小(xiǎo)∞÷φ夥伴更好(hǎo)地(dì)理(lǐ)解最×£β 小(xiǎo)貝葉斯因子(zǐ)以及貝葉斯後驗 p-valu÷"↓αe,先來(lái)說(shuō)說(shuō) p-value 的(de¶ × )正确含義。由定義可(kě)知(zhī),p-valuπ e 表示原假設下(xià)觀測到(dào)某(極端)事(shì)件(ji∞<₹↔àn)的(de)條件(jiàn)概率。因此,$™'p-value 越低(dī),說(shuō)明≈α(míng)在原假設(因子(zǐ)預期收益率為(wèi)零)下(x>§♥ià)越不(bù)太可(kě)能(néng)出現©↔(xiàn)樣本數(shù)據中的(de)"←£¶平均收益率。
若以
Harvey (2017) 通(tōng)過最小(xiǎo)貝葉斯因子(zǐ)§₽¶計(jì)算(suàn)了(le)貝葉斯後驗概率,從(cóng)而回答( dá)人(rén)們真正關心的(de)問(wèn)題
令
令
對(duì)于檢驗因子(zǐ)來(lái)說(shuō),後驗機§★ (jī)會(huì)比是(shì)我們真正關注的(de)問(♣εwèn)題。它告訴我們原假設和(hé)備擇假設後驗概率的(de)高α♦α(gāo)低(dī)——一(yī)個(g♠¥↓è)特别低(dī)的(de)後驗機(jī)會(huì)比意味著(zhe)原✔®> 假設的(de)後驗概率很(hěn)低(dī),因此≤γ我們可(kě)以安全地(dì)拒絕原假設,↔λ即認為(wèi)因子(zǐ)是(shì)真實的(de)γ$ ¶。不(bù)過,想要(yào)計(jì)算(₹↕™suàn)後驗機(jī)會(huì)比,就(jiù)必須要(yào) ε先算(suàn)出貝葉斯因子(zǐ)。但(dàn)從(c☆"δ¶óng)上(shàng)面的(de)定義可(kě)知(zhī©↓☆),計(jì)算(suàn)它時(shí)需要(yào β↑♠)指定備擇假設下(xià)的(de)先驗分(fēn)布,但(dàn)這(zh♦©è)往往非常困難。不(bù)過好(hǎo)消息是(shì),在衆多(≤₽duō)貝葉斯因子(zǐ)的(de)取值中,有(yǒu)一(y♥€ī)個(gè)特殊的(de)取值,它就(jiù£©)是(shì)最小(xiǎo)貝葉斯因子(zǐ)(minimum Bayes♦★ factor,簡稱 MBF)。
為(wèi)了(le)直觀理(lǐ)解最小(xiǎo)貝葉斯因子(zǐ),≠ ∞ 我們來(lái)回顧一(yī)下(xià)後驗機(jī)會(huì)¶♥≈λ比
直觀理(lǐ)解最小(xiǎo)貝葉斯因子(>≤∑zǐ)後,我們便能(néng)夠順水(shuǐ)推舟地(dì)搞懂(dǒλ¶→ng)如(rú)何計(jì)算(suàn)它。最小(xiǎo)貝葉斯因子$♣•(zǐ)對(duì)應著(zhe)一(yī)個(¥'₽ gè)特殊的(de)備擇假設下(xià)的(de)先驗分(fēn≠↕δ)布,提供了(le)反對(duì)原假設的(de)最強×♦¶烈證據。考慮下(xià)面這(zhè)個(gè)例子(zǐ),假設有(✘₹₽yǒu) 1000 個(gè)因子(zǐ)收益率的(de)觀測≈ ±值,其樣本均值為(wèi) 4%。那(nà)麽在什(shén)麽情況下<φ↔(xià)我們會(huì)得(de)到(dào)最小→≤(xiǎo)貝葉斯因子(zǐ)呢(ne)?這(zhè)個(g ÷è)問(wèn)題的(de)答(dá)案是(shì):在備擇假<✔' 設的(de)先驗分(fēn)布中,所有(yǒu)的(d↑↓✔✔e)數(shù)據都(dōu)集中在 4%π ¥∑ 這(zhè)個(gè)樣本均值,即備擇假設的(₹•↕÷de)先驗分(fēn)布的(de)密度集中在數(shù)據的(de)最大(&dà)似然估計(jì)值時(shí),貝葉斯因子(zǐ)是(shì)最小↓∏ (xiǎo)的(de)。
通(tōng)過以上(shàng)論述可(kě)知(zhī),最小(x∞™±iǎo)貝葉斯因子(zǐ)允許人(rén)們計(jì)算(suàn)原假設後∞¶驗概率的(de)下(xià)界。更為(wèi)關鍵的(de)是(shì),它回♣→答(dá)的(de)是(shì)人(rén)們真正關心的(de₩¶)問(wèn)題,即給定數(shù)據時(shí)原假設為(wèi)真的(d₩'±"e)條件(jiàn)概率。利用(yòng)原始 p-value♦ 或 t-statistic, Harvey¶♦↑ (2017) 給出了(le)計(jì)算(suàn)最小(xi¶↕ǎo)貝葉斯因子(zǐ)的(de)兩種方法:
此外(wài),利用(yòng)後驗機(jīδσ)會(huì)比
為(wèi)了(le)在實際操作(zuò)中應用(yòng)貝葉斯後驗 ↑₽p-value,除了(le)需要(yào)知(zhī)™≤道(dào)最小(xiǎo)貝葉斯因子(zǐ)外(wài),還(hái÷Ω)需要(yào)指定先驗機(jī)會(huì)比。π↓∑為(wèi)此,一(yī)些(xiē)經驗法則為(wèi):(1)對α∏(duì)于嚴重缺乏經濟學依據的(de)因子(zǐ),先驗機(jī)會(&γhuì)比 49:1;(2)對(duì)于似是(shì)而÷★λ非的(de)因子(zǐ),先驗機(jī)會(huì)比 4:1;(3✘♥ )對(duì)于具備經濟學理(lǐ)論依據的 γ♥☆(de)因子(zǐ),先驗機(jī)會(huì)比 1:1。
3 未來(lái)
除了(le)以上(shàng)标準意義上(sh↔•àng)的(de)貝葉斯方法,近(jìn)年(nián)來(★←&σlái)的(de)另一(yī)個(gè)新的π'(de)思路(lù)是(shì)對(duì)貝葉斯思想的ε∞>(de)拓展,即通(tōng)過先驗知(zhī)識決定真實因子(zǐ)在所δ≠₩有(yǒu)因子(zǐ)中的(de)占比,然後通(tōng)過 bi¶α€-modal mean 分(fēn)布對(duì)真實和(hé)虛假因子(zǐε↔)的(de)預期收益率建模。這(zhè)方φ'$"面的(de)代表是(shì) Harvey and Liu (202 α0, 2021)。在我看(kàn)來(lái),它們代表實證✘₩<≤資産定價中多(duō)重假設檢驗的(de)未來(lái)。
不(bù)過仍需指出的(de)是(shì),它們并非傳統意義上(shàng)的✔"₹(de)貝葉斯方法,仍屬頻(pín)率主義方法範疇。但(÷★∑dàn)由于它們都(dōu)通(tōng)過一(>↕yī)個(gè)先驗參數(shù)
回顧一(yī)下(xià),頻(pín)率☆∑•主義方法中的(de)多(duō)重假設檢驗修均可β↓↓(kě)以歸納到(dào)正交化(huà)和(hé)自(zì)助法這<∏<(zhè)兩個(gè)核心思想的(de)綜合運用(yòng)。其中正交化(huπ<≤à)的(de)作(zuò)用(yòng)是(shì)在樣↑£§"本內(nèi)剔除每個(gè)因子(zǐ)的(de©¶€)超額收益(即把因子(zǐ)轉變為(wèi)噪聲);自(zì ←)助法則是(shì)在正交化(huà)後的(de)基礎上(s€₽≠ hàng)通(tōng)過重采樣數(shù)據,以此獲得•±(de)僅由運氣造成的(de)因子(zǐ)收益率的(de) t-st€↑✔<atistic 的(de)分(fēn)布。在得(de)到(dào)±∞£該分(fēn)布後,傳統頻(pín)率主義方法往往以控制(zhì)事(sh±™♣ì)先約定的(de)第 I 類錯(cuò)誤上(shàng)限(例如(rú)常≈€•見(jiàn)的(de) 5%)來(lái)選定♥≤•© t-statistic 的(de)阈值,并以此确定真$♣∏實因子(zǐ)。在傳統方法中,存在兩個(gè)問(wèn)₩☆ε題:
1. 正交化(huà)過程通(tōng)常會(huì)對(duì)所有(δ↔ ↓yǒu)因子(zǐ)進行(xíng)(這(zhè≥ σ)隐含的(de)假設是(shì)所有(yǒu)因子(zǐ)的(de≤♦£)超額收益均為(wèi)零)。然而在現(xi☆™™àn)實中,這(zhè)種處理(lǐ)忽視(shì)了(le)₽↑>φ先驗的(de)作(zuò)用(yòng)₩¥。對(duì)于待檢驗的(de)諸多(duō)因子(zǐ)而言,人÷®(rén)們可(kě)根據金(jīn)融學先驗認為(wèi)其中一(♣•'&yī)定比例的(de)因子(zǐ)是(sh♠←ì)真實的(de),然而傳統方法忽視(shì)了(le)這(zhè∞↓≥)一(yī)信息。
2. t-statistic 阈值的(de)确定一(yī)般是(shì)以'≠ 控制(zhì)第 I 類錯(cuò)誤為(wèi)唯一(yī)÷≈>₽目标。這(zhè)麽做(zuò)的(de)結果是(s♠>hì),傳統多(duō)重假設檢驗方法的(de)第 II 類錯(cuò)誤γδ率往往很(hěn)高(gāo),因此功效(
在
在這(zhè)種背景下(xià),Harvey and Liu (2020) 通(tōng)過引入先驗知(zhī)識并使用(yòng)一(y¶§¥ī)個(gè)基于雙層自(zì)助法的(de)& α♦框架,同時(shí)解決了(le)上(shàng)述兩個(gè)問(w↔¶σèn)題。對(duì)于第一(yī)個(gè)問(wèn)題,他(tα✔ā)們借鑒了(le)基金(jīn)研究中經常γ 使用(yòng)的(de) bi-modal mean 分≈★π(fēn)布(Harvey and Liu 2018):即絕大(dà)部∞$分(fēn)因子(zǐ)是(shì)虛假的(de),它們預的(de)期收益$$α率來(lái)自(zì)均值為(wèi)零的(de)分(fēn)布;而一(yī ✔)小(xiǎo)部分(fēn)因子(zǐ)是(shì)真實的(de)>♦,它們的(de)預期收益率來(lái)自(zì)均值非™☆零的(de)分(fēn)布。人(rén)們可(kě)以根據自>≤ ₽(zì)身(shēn)的(de)經驗(即先驗)來(lái)選擇真實因子(zǐ₩→≈$)的(de)比例
以下(xià)針對(duì) A 股中常見(jiàn)的(de) 95 個(≈©gè)因子(zǐ)應用(yòng)上(shà←εng)述雙層自(zì)助法。下(xià)圖給出了(le)×→β§不(bù)同
近(jìn)年(nián)來(lái),Harvey 教授和(hé)★γ他(tā)的(de)長(cháng)期合作(zuò)γ↓≈÷者劉岩教授(對(duì),Harvey and Liu 裡(l÷'ǐ)面的(de) Liu!)一(yī)直緻力于呼籲學術(shù)界抵制 ♣(zhì)追逐超低(dī) p-value 的(de)不 σδ(bù)良學術(shù)風(fēng)氣。兩位的(de)諸≈ε多(duō)實證結果不(bù)僅質疑了(le)λπ•過去(qù)幾十年(nián)來(lái)學術(shù)研究中挖掘出的(de)" ♥€相(xiàng)當一(yī)部分(fēn)因子(zǐ),更←Ω是(shì)從(cóng)某種程度上(shàng)挑戰了(le↔÷↑)學術(shù)研究的(de)權威。然而,出于對(duì)σ>π學術(shù)風(fēng)氣和(hé)學術↕∞₽(shù)成果的(de)保護,站(zhàn)在他(tā)們對♦∑α(duì)立面的(de)質疑之聲也(yě)同樣此起彼伏。這(zhè®≤&)其中首當其沖的(de)要(yào)數(shù) Chen ★÷(2021) 和(hé) Jensen, K£ ¥σelly and Pedersen (2023)。
Chen (2021) 通(tōng)過思想實驗指出僅靠 p-hacki∑γ≥ng 根本無法解釋學術(shù)界發現(xiàn)的(₽₹↕∑de)諸多(duō)非常顯著的(de)因子(zǐ),并通(tōng)過他<←✔(tā)的(de)模型得(de)出了(le)一(yī)系列推論,間(¥®jiān)接指出對(duì)于 p-hacking 的(dε§e)擔憂可(kě)能(néng)被誇大(dà)了(le)。然而,無論是(¶§×shì)學術(shù)界還(hái)是(shì)ε♠α業(yè)界,大(dà)家(jiā)的(de)共♣§♦識是(shì)所有(yǒu)因子(zǐ)預期✔≈©收益聯合為(wèi)零(即前文(wén)提到(dào)的(de) en♣ε£←semble null 先驗)這(zhè)個(gè)原假設一επ©(yī)定會(huì)被拒絕,即人(rén)們都(dōu)認可(kě)γβ↔存在一(yī)部分(fēn)顯著因子(zǐ)。因此≠♥>δ,根本沒有(yǒu)人(rén)否認僅靠 p-hacking ✘★←$無法解釋一(yī)些(xiē)非常顯著的(φ₹de)真實因子(zǐ)被發現(xiàn)。但(dà<σn)是(shì)人(rén)們也(yě)同樣相©←'(xiàng)信,多(duō)重假設檢驗和(hé)發表★™偏差的(de)影(yǐng)響促使一(yī)些(xiē)虛假因子(zǐ)的(₩→de)誕生(shēng)。所以,在所有(yǒu)因子(zǐ)中,到(dà₩≤"<o)底有(yǒu)多(duō)少(shǎo)是(✘×shì)真實的(de)?更進一(yī)步¥δ,對(duì)于通(tōng)過多(duō)重假設檢驗修正的(de)真實因子(≤≥α★zǐ),它們的(de)收益率在樣本外(wài)的(de)收φ✔★↔縮系數(shù)又(yòu)是(shì)多(duō)少(shǎ↔♥≥ o)?然而 Chen (2021) 并沒•™♦有(yǒu)回答(dá)這(zhè)些(xiē)問(wèn)題。
面對(duì)質疑,Harvey and Liu (2021) 做(zuò)出了(le)回應。在檢驗因子(zǐ)時(shí)≈↑,除去(qù)被發表的(de)之外(wài),還(hái)需要<₽♣₽(yào)考慮因為(wèi)不(bù)夠顯著而被學者們↕¥§♠放(fàng)棄的(de)因子(zǐ),這(zhè)些(xiē)構成了(l→₩÷e)總共被嘗試的(de)因子(zǐ)。但(dàn)現(xiàn★★π)實中,總共嘗試的(de)因子(zǐ)個(gè∏σβε)數(shù)是(shì)未知(zhī)的(de)。為(wè¥×₩ i)了(le)解決這(zhè)個(gè)難題,Ha↑¶rvey and Liu (2021) 再次對(duì)因子(zǐ)←α預期收益率使用(yòng)了(le) bi-modal me ≠an 先驗分(fēn)布,并通(tōng)過≥&∞理(lǐ)論模型和(hé)參數(shù)校(xiào)準回答(λα®σdá)了(le)關鍵問(wèn)題。參數(shù)校(xiào)準的(de)結果或許讓人(rén)有(y♥&ǒu)些(xiē)意想不(bù)到(dào)(但(dàn)細想其實↔ ∑是(shì)合理(lǐ)的(de)),即這(zhè)個(gè)問(wèσ n)題本身(shēn)是(shì)未識别的(de)(÷lack of identification)。換句話(huà)∑ ↑說(shuō),它的(de)最優參數(shù)不(bù)唯一(yī)。在三組¥✘參數(shù)下(xià),模拟得(de)到(dào)的(de)統計(j≠¥≥ì)指标均和(hé)實際值較好(hǎo)地(dì)吻∞♥₩合。而這(zhè)個(gè)問(wèn)題之所以是(shì)∏α∏ 未識别的(de),原因恰恰是(shì)人(rén)們觀察到(d •€ào)的(de)隻有(yǒu)被發表的(de)因子(zǐ), ≠≠而學術(shù)界到(dào)底嘗試了(le)多(duō)少♥£ε(shǎo)個(gè)因子(zǐ)永遠(yuǎn)是(shì)未知γ δ (zhī)的(de)。這(zhè)是(shì)在 ↔€σ研究 p-hacking 問(wèn)題時(shí)注定無法逃避的(d<↓♦♦e)現(xiàn)實。至于它可(kě)能(♣•néng)的(de)取值範圍則取決于研究者的(de)經驗和(h♣♦™é)對(duì)實證數(shù)據的(d''♦>e)理(lǐ)解。
Jensen, Kelly and Pe♣£≠€dersen (2023) 是(shì)另一(yī)篇維護既往實♣↓證研究發現(xiàn)的(de)文(wén)章(zhāng)。該文(wén)通β××σ(tōng)過經驗貝葉斯模型發現(xiàn),即便考慮了(le)多(duō)重假設檢驗問(wèn)題,因π≠子(zǐ)平均收益率的(de)标準誤也(yě)無ε需被擴大(dà)(即顯著性不(bù)會(hu®§ì)受到(dào)明(míng)顯影(yǐng)響),因此絕大λ&γ(dà)多(duō)數(shù)已發表因子(zǐ↑≈γ≠)都(dōu)是(shì)成立的(de),金(jīn)融實證研究不☆∞(bù)存在複制(zhì)危機(jī)。然而,他(↔∏tā)們的(de)模型也(yě)隐含著(←©εzhe)讓人(rén)們指定真實因子(zǐ)的(de)比例(即
談到(dào)多(duō)重假設檢驗,其他(tā)學科(kē)對(≤ ₹duì)它的(de)重視(shì)其實由來(lα∑✘ái)已久,而金(jīn)融學對(duì)它的(de)重↔♣≈ 視(shì)則相(xiàng)對(duì)較晚£€。但(dàn)好(hǎo)消息是(shì★±),Harvey 和(hé)劉岩兩位教授在這(zhè)項 research∞β agenda 上(shàng)的(de)探索,已經讓人(σ∞rén)們充分(fēn)意識到(dào)這(zhè)個(₽Ω↔ gè)問(wèn)題,并開(kāi)始通(tōng)過各$種手段來(lái)降低(dī) p-hacking 的€±(de)影(yǐng)響。由于多(duō)重假設檢驗的(de)危害頗具争議(yì)性,因此學術(sh↕"ù)界以開(kāi)放(fàng)的(de)心态來(lái)討(tǎo)論它→©€至關重要(yào)。正如(rú)前文(wén)所述,因為(wèi)人(rén)♠₽™們隻觀測到(dào)了(le)被發表的(de)因子(zǐ),而不(b 'ù)知(zhī)道(dào)到(dào)底≤ε♠嘗試了(le)多(duō)少(shǎo)因♥≥←≥子(zǐ),所以這(zhè)個(gè)問(wèn)題注定是(shì)未識别的(±αde)。正因如(rú)此,對(duì) p-hacking 的§≈≤÷(de)研究确實存在主觀的(de)一(yī)面。坦然承認這(zhè)個€λ$(gè)計(jì)量上(shàng)的(de)系統問(wèn)題,并通(t↓ ōng)過合理(lǐ)的(de)先驗得(de )到(dào)令人(rén)信服的(de)結論±γ♥,才是(shì)應有(yǒu)的(de)研究态'≠π度。
最後,一(yī)圖總結多(duō)重假設檢驗的(deα∞δ)源起、中興和(hé)未來(lái)。
參考文(wén)獻
Benjamini, Y. and Y. Hochberg (199→•5). Controlling the false discεσovery rate: A practical and powerful£₩σ© approach to multiple te ≥₩sting. Journal of the Royal Statiαstical Society, Series B 57(1), 289-300.
Benjamini, Y. and D. Yekutiel•∏✘πi (2001). The control of the←✘∞ false discovery rate i← ₹→n multiple testing unde₽¶r dependency. Annals of Statistics 29(4), 1165-1188.
Bonferroni, C. E. (1936). Teoria Statistica Delle •₩Classi e Calcolo Delle Probabil¥↓ ità. Florence, Italy: Libreria Internazion ♦∑ale Seeber.
Chen, A. Y. (2021). The lim¥♥<its of p-hacking: Some thought e$♠₩≤xperiments. Journal of Finance 76(5), 2447-2480.
Chordia, T., A. Goyal, a♦ ↔nd A. Saretto (2020). Anomalies and"& false rejections. Review of Financial Stud↔★ ies 33(5), 2134-2179.
Harvey, C. R. (2017). Pr÷πδesidential address: The scientific out€→look in financial economו'•ics. Journal of Finance 72(4), 1399-1440.
Harvey, C. R. and Y. Liu (20&$π18). Detecting repeatable perform≠>ance. Review of Financial Studies 3✘" <1(7), 2499-2552.
Harvey, C. R. and Y. Liu (2020). ×←False (and missed) discoveries in fi"≤₽←nancial economics. Journal of Finance 75(5), 2503-2553.
Harvey, C. R. and Y.±σ© Liu (2021). Uncovering theδπ≈ iceberg from its tip: A model of pubΩ↔¥lication bias and p-hacking. Duke Un¶λiversity, Purdue University.
Harvey, C. R., Y. Liu, and A. Saretto>σφ® (2020). An evaluation ofα alternative multiple testing metγ×₹÷hods for finance applica↔₩tions. Review of Asset Pricing Studies 10(2), 199-248.
Harvey, C. R., Y. Liu, ₹>₹•and H. Zhu (2016). ... and the ↕±÷cross-section of expect₹♦ ed returns. Review of Financial Studies 2π←"9(1), 5-68.
Holm, S. (1979). A simple∑™≠₹ sequentially rejective multiple t♥Ω©÷est procedure. Scandi®↔€♥navian Journal of Statistics 6(2), 65-70.
Hou, K., C. Xue, and L. Zhang (2 ✔020). Replicating anomalies.₩€&∏ Review of Financial Studies 33(5), 2019-2133.
Huang, S., Y. Song, a< nd H. Xiang (forthcominδ•g). The smart beta mirage. Journal of Financial and Quantε ε¥itative Analysis.
Jensen, T. I., B. T. Kelly, and ±®↔πL. H. Pedersen (2023). Is '←there a replication crisis♥±λ in finance? Journal of Finance 78(5), 2465-2518.
McLean, R.D. and J. Pontiff (201λ€6). Does academic research desφ≥troy stock return predictab ♦ility? Journal of Finance 71(1), 5-32.
Romano, J. P., A. M. Shaikh, and M. Wo≥lf (2008). Formalized data sβ♦®nooping based on generalized≤π error rates. Econometric Theory 24(2), 404-447.
Romano, J. P. and M. Wolf (2005). Stepw £Ωise multiple testing as fo&φ♥rmalized data snooping← ₽. Econometrica 73(4), 1237-1282.
Romano, J. P. and M. Wolf (2007). Con€☆©trol of generalized error rates i"←<n multiple testing. Annals of Statistics 3&≤ 5(4), 1378-1408.
Scott, J. G. and J. O. Berger (20≤∏06). An exploration of aΩ φ spects of Bayesian multip♠>÷le testing. Journal of Statistical Planning a€nd Inference 136(7), 2144-2162.
White, H. (2000). A reality check forπ♦© data snooping. Econometrica 68(5), 1097-1126.
免責聲明(míng):入市(shì)有(yǒu)風(fēng) δ險,投資需謹慎。在任何情況下(xià),本文(δ®•wén)的(de)內(nèi)容、信息及數(sh>✔$ù)據或所表述的(de)意見(jiàn)并不(bù)構成對(duσ↑ì)任何人(rén)的(de)投資建議(yì)。在任何情況下(€✔★xià),本文(wén)作(zuò)者及所屬機(jī)構不(bù)對(duì÷®)任何人(rén)因使用(yòng)本文(wén)的(de)任何內(n↓σèi)容所引緻的(de)任何損失負任何責任。除特别說(shuō)明(mí×ng)外(wài),文(wén)中圖表均直接或≈★間(jiān)接來(lái)自(zì)于相<δ(xiàng)應論文(wén),僅為(wèi)介紹之用(©¶↓yòng),版權歸原作(zuò)者和(hé)期刊所有(₽§€yǒu)。