
Financial Machine Learning
發布時(shí)間(jiān):2023-07-20 | &nb"δβsp; 來(lái≤→)源: 川總寫量化(huà)
作(zuò)者:石川
摘要(yào):跟著(zhe)兩位大(dà)佬一(yī)起洞悉金(jīn→→γ)融機(jī)器(qì)學習(xí)的(de)最新學術(shù)前沿。
近(jìn)日(rì),Bryan Kelφ♣÷ly 和(hé)修大(dà)成兩位教授的(de)最新力作(zu¥®β®ò) Financial Machine Learning 上(shàng)線 SSRN。
作(zuò)為(wèi)機(jī)器(qì)學習(xí)和(hé)實•'₩證資産定價交叉領域中你(nǐ)不(bù)可(kě)能(néng)忽視(shì)λφ↓的(de)兩個(gè)名字,他(tā)們二位對(duì)金(jīn≥₽)融市(shì)場(chǎng)中最新的(de)機(jī)器" ±π(qì)學習(xí)文(wén)獻進行(xíng)了(le)梳理(lǐ §•)并提供了(le)該領域研究中的(de)經典範例。該文(wé₩ n)近(jìn) 150 頁,旨在幫助對(duì)機(j®Ω±ī)器(qì)學習(xí)工(gōng)具感興趣的(de)金♠•★(jīn)融經濟學家(jiā)、統計(j↔λ ì)學家(jiā)以及投資從(cóng)業(yè)者了(le)↕ §♦解最新的(de)研究成果,其目錄如(rú)下(xià)(光(♠↓₹guāng)看(kàn)目錄就(jiù)足夠讓人(rén)躍躍欲試)。
這(zhè)篇文(wén)章(zhāng)也(γ∞ yě)讓我想起了(le)之前和(hé)王熙Ω•老(lǎo)師(shī)翻譯的(de) Nagel 的(de) Machine Learning in Asset Pricing。毫無疑問(wèn),這(zhè)兩篇力作(zuò)的(de)風(fēng)格™>≥(專業(yè)性、嚴謹性、時(shí)效性)都(dōu)是(shì)我非™×常推崇的(de),也(yě)均是(shì£σ")這(zhè)個(gè)交叉領域非常重要(yào)★<的(de)學習(xí)資料。為(wèi)此,今天就(jiù)來(lái)全α•文(wén)翻譯 Financial Machine Learning 的(de)第一(yī)章(zhāng)。感興趣的(de)小(xiǎo)夥伴請(qǐng)自(∞€₽zì)行(xíng)下(xià)載和(hé)≥✔≠閱讀(dú)原著的(de)其他(tā)章(zhāng)節。特别感謝(xiè)≤ 劉洋溢和(hé)王熙兩位老(lǎo)師(shī)提出的$₹(de)寶貴修改建議(yì)。
最後,本翻譯僅供學習(xí)交流使用(yòng),禁止一(yΩ€φ&ī)切商業(yè)行(xíng)為(wèi),未經授權,禁±>←止轉載。
1.1 價格即預測
現(xiàn)代金(jīn)融市(shì)場(chǎng)分α§ ™(fēn)析聚焦于如(rú)式 (1.1) 所示的(de)關于價格的(¥₽'>de)定義,它源自(zì)投資者的(de)一(yī)般(跨期)優化€"ε'(huà)條件(jiàn):
該公式的(de)含義是(shì),資産價格
在實際中,通(tōng)過預期收益率或者“折現(xiàn)率”來(lái)分 § (fēn)析價格十分(fēn)常見(jiàn)。利用(yòng)它們σ→'和(hé)價格的(de)等價關系,我們可(kě)以通(tōng)過 £¥€
其中
更一(yī)般地(dì)說(shuō),通(tōng)過對(★λ♠★duì)數(shù)據同質化(huà)處理(lǐ)(譯£∞者注:使其具有(yǒu)相(xiàng)同或相(xiàng)似π♦性質)可(kě)使數(shù)據具有(yǒu)↑₩÷≥易于處理(lǐ)的(de)變化(huà)規律和(hé)縮放(fàng)π✔屬性,因此通(tōng)過收益率來(lái)研究市(shì)場(chǎng)現(xiàn☆δ≥)象有(yǒu)助于降低(dī)研究人(rén)員→∑σ(yuán)的(de)建模難度。此外(wài),收♣•&↑益率本身(shēn)也(yě)是(shì)預測,且關于它們的(δ★de)解釋十分(fēn)清晰且具有(yǒu)很(h←δ™ěn)強的(de)實用(yòng)性。
1.2 龐大(dà)的(de)信息集
金(jīn)融研究中的(de)兩個(gè)特性使它自 ✘←(zì)然而然成為(wèi)了(le)應☆≠€₹用(yòng)機(jī)器(qì)學習(x•≠ ×í)方法的(de)沃土(tǔ):(1)龐大(dà)的(de)條件(jiàn)信→ ←息集和(hé)(2)模糊的(de)函數(shù)•>關系(譯者注:這(zhè)裡(lǐ)指的(de)是(shì)信息和(h§¥πé)預期收益率之間(jiān)的(de)潛在關系是(shì)未知(z₩ε₽hī)且複雜(zá)的(de))。由式 (1.1) 可(kě)知(zhī),×資産價格的(de)研究與信息密切相(xiàng)關。金(jīn♠₽∏)融經濟學研究的(de)核心問(wèn)題∏≥包括“市(shì)場(chǎng)參與者擁有(yǒu)什(shén)麽信δ©δ息以及他(tā)們如(rú)何使用(yòng)它±φ↓¶?”價格中所反映出的(de)預測由和(hé)<未來(lái)資産償付(
金(jīn)融市(shì)場(chǎng®β)數(shù)據的(de)面闆屬性使得(de)和↔α(hé)價格有(yǒu)關的(de)信息範疇變得•'©¶(de)更加龐大(dà)。對(duì)于給定資産來(lái)說(shu₹₽γō),其價格在時(shí)序上(shàng)的(de)變化(huà)↔←&$極具研究價值,這(zhè)對(duì)應著(zhe) ←→面闆數(shù)據的(de)時(shí)序維度。另一(α✘≠ yī)方面,在任何一(yī)個(gè)時↔φ®(shí)點,資産的(de)價格在截面上(shàng¥∑)的(de)差異同樣不(bù)容忽視(shì),§'這(zhè)對(duì)應著(zhe)面闆數(shù)據↑®的(de)截面維度。市(shì)場(chǎng)環境£↓®随時(shí)間(jiān)的(de)變化(huà)将會∞÷®→(huì)以相(xiàng)互關聯的(de)方式影(yǐng)£ ↕響諸多(duō)資産。例如(rú),大(dà)多(duō)數★γ✘(shù)資産在高(gāo)風(fēng)險和(hé)低(dī)₹ ±風(fēng)險,或者不(bù)同的(de$™)政策環境下(xià)的(de)表現(xiànγ↓₹)均會(huì)出現(xiàn)差異。随著(zh∏★e)宏觀經濟條件(jiàn)的(de)變化↓ ↔(huà),資産價格由這(zhè)些(xiē)共同影(yǐng)響驅動✔'而發生(shēng)同步調整。另一(yī)方面,不(bù)Ω✘同的(de)資産或者不(bù)同組的(de)資産&♦₩↔會(huì)在截面上(shàng)出現(xiàn)不 €☆•(bù)同的(de)行(xíng)為(wèi)。因此,條件(jiàn)信♦♥∏☆息不(bù)僅僅具有(yǒu)時(shí)序性質,而且還(hái♠→♣±)具備資産層面的(de)屬性。一(yī)個(gè)好(hǎo)的(d ♣e)資産定價模型應能(néng)夠同時(shí)刻畫(huà)導緻資産價格$•Ω共同變化(huà)的(de)共性因素以及驅動資産價格截面 ® 差異的(de)資産自(zì)身(shēn)因素(♠>$其本身(shēn)可(kě)能(néng)是(shì)靜(₹✔®✔jìng)态或動态的(de))。對(duì)此,Gu, Kell×♠y and Xiu (2020) 指出:
金(jīn)融行(xíng)業(yè)已經積累出了(le)一(yī)份♠₹令人(rén)震驚的(de)預測指标列表,其₹δ←♦中的(de)每個(gè)指标都(dōu)被學者們證明(míng)能(néng)¥γ夠預測收益率。文(wén)獻中報(bào)告的(de)資産₩'&∑層面的(de)預測特征有(yǒu)數(shù)百個(gè)之多( ÷duō),而預測市(shì)場(chǎng)整體(tǐ)的(de)宏觀經濟指φ♥♠标也(yě)有(yǒu)數(shù)十個(★Ω✘↔gè)之多(duō)。
此外(wài),考慮到(dào)每項金(jīn)融↑"↔∑經濟學研究往往隻研究一(yī)個(gè)或少(shǎo)數(shù)<"≤幾個(gè)變量,因此我們可(kě)以猜想還(hái)★σ£有(yǒu)廣泛的(de)領域未被觸及。例如(rú),直到(dào)最近(j®±ìn),新聞文(wén)本的(de)信息內(nèi)容才被用(yòng)來(lái)作(zuò)為>₩σ≈(wèi)經驗模型 (1.1) 的(de)輸入,因÷×此可(kě)以預期該領域以及其他(tā)前≠≥±沿領域還(hái)有(yǒu)很(hěn)大(dà)的(de)擴展空(kōng'±β±)間(jiān)。
1.3 模糊的(de)函數(shù)關系
如(rú)果資産價格反映對(duì)未來(lái)償付的(de£)預期,那(nà)麽預測模型就(jiù)是(shì)研究價格的(de)統計(jε δλì)工(gōng)具。金(jīn)融市(shì)場(c&γ hǎng)研究中的(de)傳統計(jì)量經濟學←'$ε方法(例如(rú) Hansen and Singlet♠♦on 1982)首先根據理(lǐ)論經濟模型♦¥為(wèi)收益率預測模型設定了(le)♣∏σ一(yī)個(gè)函數(shù)形式,然後再估計(jì)其參數(sh✘'ù),以理(lǐ)解在所選擇的(de)模型約束內(nèi),潛在信φ✘↕§息源與所觀察到(dào)的(de)市(shì)場(chǎng)→¥ ≠價格之間(jiān)的(de)關聯。然而,我們應該以文(wδ§én)獻中提出的(de)哪個(gè)經濟模型為(wèi)出發點呢(ne)♦±♦?
式 (1.1) 中的(de)一(yī)階條件(jiàn)或“歐拉方程₽δ”的(de)表述足夠寬泛,使之能(néng)夠包含各種結構性經濟假設。±×♣♥這(zhè)種通(tōng)用(yòng)性是(sh♣₩≠✘ì)有(yǒu)理(lǐ)由的(de),因為(wèi)人(rén)們£>尚未就(jiù)哪種具體(tǐ)的(de)結構化(huà)公δ✔∏₩式更好(hǎo)達成共識。早期的(de)基于消費<• (fèi)的(de)定價模型(譯者注:宏觀金(jīn)融模♥☆型)在大(dà)多(duō)數(shù)評價标準下(xià)均♠₹↔無法匹配市(shì)場(chǎng)價格數(shù)據(例如₩(rú) Mehra and Prescot¥↔t 1985)。如(rú)果将衡量成功的(de)标準降的(de)足夠低(dīΩ"♠§),那(nà)麽現(xiàn)代結構模型在∞¶£匹配價格數(shù)據方面則表現(xiàn)的(de)要(yào)₽εγ✔稍好(hǎo)一(yī)些(xiē)(例如(rú) Chen, Dou ÷✘₽λand Kogan forthcoming),不(bù)過這(zhè)≤¥≈些(xiē)模型描述的(de)現(xiàn)象通(tōng)常僅限于®Ω少(shǎo)數(shù)資産,且評估的(de)結果僅僅是(shì)基$₹于樣本內(nèi)數(shù)據。
鑒于結構模型難以貼合實證數(shù)據,過去✔®☆ε(qù)二十年(nián)的(de)大(≥δ→≥dà)多(duō)數(shù)實證研究已選擇摒棄結$✘λ≤構化(huà)假設,轉而轉向更為(wèi)₹±靈活的(de)“簡化(huà)形式”(reduced-form mod♦σ™el)或“無套利”框架(譯者注:在經濟學中,reduced-form m$×odel 是(shì)指模型的(de)輸出隻是(sh↕™←ì)輸入變量的(de)函數(shù),而不(bù)直接假設底層經濟行(&γαxíng)為(wèi)邏輯。換句話(huà)說(shuō),reduced-f↔♣×orm model 尋找輸入變量和(hé)輸出變量之♥♥∏ 間(jiān)的(de)統計(jì)關系。這(zhα>è)與結構模型相(xiàng)反,結構模型試©↓圖詳細地(dì)建立和(hé)估計(jì)底層的(de)經濟行(xín±g)為(wèi)和(hé)機(jī)制(zhìπ<),甚至結構模型能(néng)夠實現(xiàn&<)諸如(rú)反事(shì)實分(fēn)↔× 析一(yī)類的(de)高(gāo)階因果£λ推斷分(fēn)析)。雖然關于市(shì)場(chǎng)γ "的(de)實證研究通(tōng)常避免強加具體(tǐ)的©≠↓₹(de)經濟結構,但(dàn)它們通(tōng)常會(≤↕§≤huì)施加統計(jì)結構(例如(rú),以低(dī)維多(duō)←↔因子(zǐ)模型或其他(tā)參數(shù)化(huà)假設的(de)形式)。•☆¥然而,即便在簡化(huà)形式的(de)模型中也(&®γ✔yě)有(yǒu)很(hěn)多(duō)統計(j<αì)結構可(kě)供選擇,因而探索靈活模型是(shì)值得(de)的(de)£>,因為(wèi)後者可(kě)以容納許多(£↑α₹duō)不(bù)同的(de)函數(shù)形"∏β式,并且可(kě)以應對(duì)不(bù)同程度的(de•$¶>)非線性關系以及變量之間(jiān)的(deβ )交互作(zuò)用(yòng)。
這(zhè)就(jiù)是(shì)諸如(rú)核方法、懲罰≠β 似然估計(jì)量、決策樹(shù)和(hé)神經網絡等機(jī)∑↑器(qì)學習(xí)工(gōng)具的(de)應✔∏☆用(yòng)場(chǎng)景。由多(duō)種非參數( ≠λshù)估計(jì)量和(hé)大(dà)型參數(shù&₹₹¶)模型組成,機(jī)器(qì)學習(xí)方法正是(shì)為(w★&èi)了(le)逼近(jìn)未知(zhī)的(de€σ♥ )數(shù)據生(shēng)成函數(shù)而生(shēng)®→<↑。此外(wài),機(jī)器(qì)學習(xí)可(k£ě)以将許多(duō)數(shù)據源整合到(dào)一(yī)個(∏∑gè)模型中。由 1.2 節的(de)討(tǎo)論可(kě)知(zhī)÷>,為(wèi)了(le)更好(hǎo)地(dì)對(duì)價格或®€<者預期收益率建模,我們需要(yào)豐富的(de)條件(jiàn)信息集
我們使用(yòng)的(de)條件(jiàn)信息→↑集越豐富,模型就(jiù)會(huì)越貼近 ÷(jìn)現(xiàn)實。同樣的(de)©Ω邏輯适用(yòng)于函數(shù)形式問(wèn)><題。市(shì)場(chǎng)參與者不δ '↕(bù)僅将豐富的(de)信息納入預測,而且他(tā)們利用(yò¶<ng)推理(lǐ)和(hé)直覺,使用(yòng)非常複雜(zá)的(™>de)方式來(lái)進行(xíng)預測。我們必須認識到(dào),作÷₩≥€(zuò)為(wèi)研究者,我們無從(cóng)知(zhī)道(™£dào)投資者使用(yòng)信息的(de)具體(tǐ)方式,因∑♦®此也(yě)就(jiù)無法在參數(shù)統計(jì)模型中詳盡地(dì)(✘∑當然更不(bù)可(kě)能(néng)簡潔地(dìπ← ))指定該方式。正如(rú) Cochrane (2005) ₩♦≤≥提醒我們在考慮條件(jiàn)信息時(shí)要(yào)謹慎一(yī)樣,我<£ 們在考慮函數(shù)形式時(shí)也(yě)必須同∞β£σ樣謹慎。
1.4 機(jī)器(qì)學習(xí) vs 計(jì)量經濟學
到(dào)底什(shén)麽是(shì)機(j₽ ī)器(qì)學習(xí),它與傳統的(d↔¥e)計(jì)量經濟學有(yǒu)何不(bù)同?Gu, Ke±'✔•lly and Xiu (2020) 強調,機(jī)器(qì)學習(xí)的 ←(de)精确定義尚無定論,且其定義有(yǒu)時(shí)會(huì)因≈≥✘使用(yòng)者的(de)市(shì)場(chǎng)營銷目的(de'≥¶ )而扭曲。我們遵循 Gu, Kelly and Xiu (2₽♥♥±020) 的(de)定義,将機(jī)器(qì)學習(xí)♠≠描述為(wèi)以下(xià)三方面的(de)總和(hé):(i)用(yòλ$☆ng)于統計(jì)預測的(de)多(duōγ∑€)樣化(huà)高(gāo)維模型的(de)<∑♥集合,(ii)用(yòng)于模型選擇和(hé)降低(dī)過拟合的(≤×€de)“正則化(huà)”方法,以及(iii)用(yòng)于搜索大(dà)量•¥潛在模型設定的(de)高(gāo)效算(suàn↔✘ )法。
根據這(zhè)個(gè)定義,金(jīn)融機(jī)器(qì)學習(™xí)可(kě)被理(lǐ)解為(wèi)一(yī)套用(yòng)于估計(jα ì)統計(jì)模型并使用(yòng)該模型進行(xíng)決策的(de)程序 €♥σ。因此,從(cóng)本質上(shàng)講εφ♦ ,我們無需将機(jī)器(qì)學習(xí)與計(jì)量經濟學或統計(α←jì)學區(qū)分(fēn)開(kāi)來(lái)。機(×±®jī)器(qì)學習(xí)背後的(de)很(hěn)多≥&≈(duō)理(lǐ)念在過去(qù)幾十年(nián)裡(lǐ)已經在統計(j✘→♥ì)學的(de)大(dà)旗下(xià)∞ε§生(shēng)根發芽(Israel, Kelly and Mo£ skowitz 2020)。
為(wèi)了(le)通(tōng)過數(shù)據來(lái)學習(xí★♦ασ),機(jī)器(qì)需要(yào)一(yī)個(gè→ ∞)關于其學習(xí)任務的(de)函數(sh ∑π♣ù)化(huà)表達。研究者必須對(duì)此做(z∞✔uò)出選擇 —— 這(zhè)将決定我們将會(•≈huì)從(cóng)數(shù)據中得(de)到(dào÷✔∞©)怎樣的(de)發現(xiàn)。前述關于機(₩←β≥jī)器(qì)學習(xí)定義的(de)第(i)部∏↔£分(fēn)指出,機(jī)器(qì)學習(xí)對(d ✔≥∑uì)函數(shù)化(huà)表示幾乎沒有(yǒu)約束,它可(kě)<™以是(shì)高(gāo)度參數(shù)化(huà)且通(tōng)→✘常是(shì)非線性的(de)。另一(yī)方面,小(xiǎo)模型往往€÷不(bù)夠靈活且過于簡化(huà),但(dàn↕÷'$)其簡潔性有(yǒu)利于精确的(de)參數(shφ↑ù)估計(jì)并很(hěn)容易解釋。大(dà)型和(hé)複✔←Ω雜(zá)的(de)模型則要(yào)靈活得(de)多(duō←₩),但(dàn)也(yě)可(kě)能(néng)對(duì)樣本內(nè¥"i)的(de)噪聲更加敏感,并因為(wèi₩♥)對(duì)噪聲的(de)過拟合而削弱其在樣本外(wài)的(de)表©¥™÷現(xiàn)。當研究者認為(wèi)更準确地(dì)描述現♣α☆∏(xiàn)實世界的(de)複雜(zá)現(xiàn)象所帶來(lái)的∑∑₹←(de)好(hǎo)處超過過拟合的(de)成本時(shí),他(tā)們便ε₩會(huì)轉而使用(yòng)大(dà)模型。從(cóng)直觀上(shàn"$β¥g)講,當分(fēn)析師(shī)不(bù)确定其統✘計(jì)模型應采取哪種具體(tǐ)結構化(huà)假設時(shí≥∞),機(jī)器(qì)學習(xí)便提供了(le)₽'¶進行(xíng)統計(jì)分(fēn)析的(de)另一(yī)¥<≈•種途徑。從(cóng)這(zhè)個(gè)意義上(shà↕ו♥ng)講,大(dà)部分(fēn)的(de)機(€§→jī)器(qì)學習(xí)可(kě)以被π¥視(shì)為(wèi)非參數(shù)(或半參數(shù))↓α α化(huà)建模。其運行(xíng)範式' 考慮了(le)各種可(kě)能(néng)的(de)模型設←↓↕定,并通(tōng)過數(shù)據的(de)指引來(lái)确∞™∑定哪個(gè)模型對(duì)于手頭待處理(lǐ)的(de)問(wè'★×n)題最為(wèi)有(yǒu)效。有(yǒu)人(rén₩↕)可(kě)能(néng)會(huì)問(wèn):π分(fēn)析師(shī)何時(shí)知↕€(zhī)道(dào)什(shén)麽結構化(hu±γ→à)假設适合他(tā)們的(de)統計(jì)分↑←✘↑(fēn)析?答(dá)案當然是(shì)“永遠(yuǎn)≈&∞ε不(bù)會(huì)”,而這(zhè)就(jiù)是(shì)為(wè∏λi)什(shén)麽機(jī)器(qì)學習(xí)在金(jīn)融研究π→中大(dà)有(yǒu)可(kě)為(wèi)。正如( "π∏rú) Breiman (2001) 所強調的(de),機(jī)₹↔σ器(qì)學習(xí)與傳統統計(jì)學研究目标的(de)最根本差異在$¥于,前者在未知(zhī)數(shù)據模型的(de∏∏Ωλ)前提下(xià)最大(dà)化(huà)預測準确性,而後者則在假設數(β>shù)據模型已知(zhī)的(de)前提下(x®∞× ià)估計(jì)模型參數(shù)并進行(xíng)統計(jì £)檢驗。
定義的(de)第(ii)部分(fēn)強調,機(jī)器(qì♥→≤)學習(xí)從(cóng)“多(duō)樣化(β♠δhuà)的(de)候選模型集合”中選擇一(yī)個(gè)最佳模型(或模≈♣型組合)。同樣的(de)想法以模型選擇(或與之相(xiàng)關的δ∏(de)模型平均)的(de)概念早已存在¥δ¥λ于計(jì)量經濟學方法中。二者的(de)不(bù)同之處在于,機(jīφ± β)器(qì)學習(xí)将模型選擇置于實證設計(jì)的(de)核心。尋找σα<具有(yǒu)最優樣本外(wài)預測性能(néng)模型的(d↑e)過程(通(tōng)常被稱為(wèi)模型“調優”)是(shì)機(j©÷ī)器(qì)學習(xí)方法的(de)>≈∑₩重要(yào)特征。當然,從(cóng)諸多(duō)€∑ 模型中機(jī)械地(dì)選擇會(hu•π↔¥ì)發生(shēng)樣本內(nèi)過拟合,從(cóng)而削弱樣本外(w ★★ài)的(de)表現(xiàn)。因此,機(jī)器(q☆₹↑≤ì)學習(xí)的(de)研究過程往往伴随著(zhe"€↔)“正則化(huà)”,它是(shì)一(yī)個(gè)用(yòng)于♠π¥✔約束模型大(dà)小(xiǎo)以确保樣本外(wài)性能(néng)穩 ←定性的(de)通(tōng)用(yòng)術(shù)語。€₽±←正如(rú) Gu, Kelly and Xiu ÷Ω∑§(2020) 所說(shuō),“最優模型是(shì)一(yī)個(gè)‘恰到( εφdào)好(hǎo)處的(de)’模型。一(yī)方≤✘₹"面,它足夠大(dà)因而能(néng)夠可(kě)靠地(✔&>γdì)識别出數(shù)據中可(kě)能(néng)存在的(de)複雜(z§¥♠á)預測關系,而另一(yī)方面它又(y'αòu)不(bù)至于過于靈活以至于由過拟合主✔π導,從(cóng)而影(yǐng)響樣本外(wài)×∑λ的(de)表現(xiàn)。”正則化(huà)方法傾向于産生(shē✔↔γng)較小(xiǎo)的(de)模型;隻有(yǒu)當更豐富的♦∑(de)模型能(néng)夠真正提升樣本外(wài)預測準确性時(s♠γhí),它們才能(néng)夠脫穎而出。
機(jī)器(qì)學習(xí)定義中的(de)第(iii)個(gè)組成€✘→§部分(fēn)也(yě)許是(shì)它與傳統統計(jì)學最→σ±<明(míng)顯的(de)不(bù)同之處,但(dàn)也(yφ₽ ě)可(kě)能(néng)是(shì)經濟學直覺最為¥σ↑₩(wèi)最欠缺的(de)部分(fēn)。當數(shù)據集很(hěnλ )大(dà)且/或模型參數(shù)太多(duō)時(shíφ§™π),計(jì)算(suàn)量有(yǒu)可(kě)能(n™↔•≥éng)成為(wèi)瓶頸。機(jī)器(qì)學習(xí φ$∞)已經發展出各種近(jìn)似優化(hu§§×à)方法來(lái)減少(shǎo)計(j>↑<ì)算(suàn)負載。例如(rú),傳統的(d™¥€e)計(jì)量經濟學估計(jì)量通(tōng♦✘)常在叠代優化(huà)過程的(de)每一(yī)步中使用(yòng)©所有(yǒu)數(shù)據點,并且隻有(yǒu)在結果收斂時(σ shí)才停止參數(shù)搜索。而諸如(rú)使用(yòngπ© )數(shù)據子(zǐ)集以及在收斂前停止搜索等'₹捷徑通(tōng)常能(néng)夠以很(hěn)小(xiǎ∑'•±o)的(de)準确性損失為(wèi)代價而大(dà)大(dà∞✘)減少(shǎo)計(jì)算(suàn)量(≥←例如(rú),随機(jī)梯度下(xià)降和(hé)早停法是(shì)訓↓練神經網絡時(shí)的(de)兩個(gè)基本Ωσ要(yào)素)。
1.5 金(jīn)融學中應用(yòng)機(jī)器(qì)學習(xí)的(d×₩e)挑戰(及施加經濟學約束的(de)好(hǎo)處)
盡管金(jīn)融研究在許多(duō)方面都(dōu)非常适合機(jī)器(qΩì)學習(xí)方法,但(dàn)金(jīnγπ)融領域的(de)某些(xiē)方面也(yě)對(duì)機(∞©"¶jī)器(qì)學習(xí)提出了(le)挑戰。理(lǐ)解這(>♥zhè)些(xiē)障礙對(duì)于形成關于金(jīn)融機(jī)器(q∑<ì)學習(xí)益處的(de)正确預期至≥α關重要(yào)。
首先,雖然機(jī)器(qì)學習(xí)通(tōng)常被視(shì)®♥為(wèi)一(yī)個(gè)“大(dà)↓✘©數(shù)據”工(gōng)具,但(dàn)許多(duō)金(jīn)融÷↑φ學領域的(de)基礎問(wèn)題都(dōu)飽受經濟時(shí)≈δδ間(jiān)序列中有(yǒu)限數(shù)據量的(de)困擾。例如(rε<ú),在宏觀金(jīn)融中,标準數(shù)據集僅包含幾δ€♥百個(gè)月(yuè)度觀測值。如(r€±ú)此程度的(de)數(shù)據稀缺現(xiàn)實在其∑≠✔₩他(tā)機(jī)器(qì)學習(xí)領域是(shì)十分(fē≥•n)罕見(jiàn)的(de);在其他(tā)領域中研$λγ究者通(tōng)常具有(yǒu)(出于各種意圖和(≥λ♠hé)目的(de))無限的(de)數(shù)據(或具備在需要(yào)時÷©≈↕(shí)生(shēng)成新數(shù)據的(de)能(nén★"g)力)。而在關于時(shí)間(jiān)序列的(de)研究中,<•₹新數(shù)據隻有(yǒu)随著(zhe)時(s≤©hí)間(jiān)的(de)推移而累積∏∑←。
其次,金(jīn)融研究經常面臨低(dī)信噪比問(wèn)題。這(zhè)一♣∏(yī)點在收益率預測中最為(wèi)明(míng)顯,這(zh↕≥≈è)是(shì)因為(wèi)市(shì)場(chǎng)有(®₩yǒu)效性的(de)力量(利潤最大(dà)化(huà™©£≠)和(hé)競争)始終在努力地(dì)消除價格走勢中的(de≠™)任何可(kě)預測性(Samuelson 1965; ™§±Fama 1970)。因此,可(kě)以預見(jiàn)價格變化(hu§Ωà)的(de)主要(yào)來(lái)源是(shì)意≥↓γ料之外(wài)的(de)新息(對(duì)于模型♥σ≤而言,這(zhè)是(shì)無法預測的(de)噪聲)。市(s¶πhì)場(chǎng)也(yě)可(kě)能✔ (néng)表現(xiàn)出無效性,投資↓÷者偏好(hǎo)也(yě)可(kě)能(™≤néng)産生(shēng)随時(shí)間(ji☆> ān)變化(huà)的(de)風(fēng)險溢價,從(cóng)而導緻一(y ≠£©ī)定的(de)收益率可(kě)預測性。盡管如(rú)此,我們仍應預期收•♣∞益率的(de)可(kě)預測性很(hěn)低(d$♦ī)、但(dàn)關于可(kě)預測性的(€"'δde)競争卻非常激烈。
第三,市(shì)場(chǎng)會(hu®←δì)随時(shí)間(jiān)不(bù)斷演變而身(>←™shēn)處其中的(de)投資者也(yě)會(huì)持續學習(xí)。因此$•₩✘機(jī)器(qì)學習(xí)預測模型的(∑÷de)目标并非一(yī)成不(bù)變。先前得(de)到(σ dào)的(de)可(kě)靠的(de)預測模式可✔∏(kě)能(néng)會(huì)因套利而被消除≠•γ↕。監管和(hé)技(jì)術(shù)變化(huà)也€×π§(yě)可(kě)能(néng)會(huì)使經濟結構®₩發生(shēng)變化(huà)。結構不(bù)滿足平穩性✔≤±★使金(jīn)融學對(duì)于機(jī)器(qì)學習(xí)而言成為$∏(wèi)一(yī)個(gè)特别複雜(λ∞®≈zá)的(de)領域,且不(bù)滿足平穩性進"¶一(yī)步加劇(jù)了(le)有(yǒu)限數(sh∏≈<§ù)據量以及低(dī)信噪比帶來(lái)的(de)挑戰。
這(zhè)些(xiē)挑戰也(yě)提供了(le)一(yī)個(g耧 •)機(jī)會(huì),讓人(rén)們可(kě)以從∏¥£¶(cóng)經濟理(lǐ)論知(zhī)識中獲益。如✔(rú) Israel, Kelly and ≥♣εMoskowitz (2020) 指出:
統計(jì)分(fēn)析的(de)一(yī)個(g¥ ♣♥è)基本原則是(shì),理(lǐ)論和(hé)模型參數(shù)可(£≠kě)以相(xiàng)互替代。你(nǐ)在模型中"±施加的(de)結構越多(duō),你(nǐ)需要(yào)估計(jì)的(deσ↓£)參數(shù)就(jiù)越少(shǎo),且模型能(néng)夠更有¶σΩ(yǒu)效地(dì)使用(yòng)可(kě)用(yòng)的(d™πe)數(shù)據來(lái)減少(shǎo)噪聲。也(≠ >±yě)就(jiù)是(shì)說(shuō),由于能(nλ< éng)夠過濾掉噪聲,因此模型是(shì)有(yǒu)用(≈♥✔✔yòng)的(de)。但(dàn)是(shì),✔✘過于簡化(huà)的(de)模型也(yě)可(kě)能(néng)過✘∏♠σ濾掉一(yī)些(xiē)信号,所以在數(sh≠×ù)據充盈且信噪比高(gāo)的(de)環境中,人(rén)們往往不(bù)&↔≈♦希望使用(yòng)一(yī)個(gè)不→♥(bù)必要(yào)的(de)小(xiǎo)模型。通(tōngπ±☆)過引入經濟學理(lǐ)論來(lái)描述數(shù)據的(de)某些(x•♣iē)屬性,并配合機(jī)器(qì)學習(xí)算(suàn)法來(lái)♠ ★捕獲理(lǐ)論無法描述的(de)數(shù)據的(de)另外(wà←←i)一(yī)些(xiē)屬性,人(rén) 們便可(kě)以開(kāi)始解決數(shù)據量有(yǒu)→☆限和(hé)信噪比很(hěn)低(dī)這(zhè)兩個(gè)問(wè✔λ•n)題。
1.6 經濟學內(nèi)容(金(jīn)融經濟學的(de)兩種文(w×↔én)化(huà))
我們回顧一(yī)下(xià) Breiman (2001) 關于統計•≤☆♦(jì)學中 “兩種文(wén)化(huà)”的(de)論述,♣÷經過适當修改,它在金(jīn)融經濟學中也(yě)有(♠&↕yǒu)一(yī)個(gè)類比。第一(yī)種是(s ¶hì)“結構模型/假設檢驗”文(wén)化(huà),它傾向于施加完全或部分(α'fēn)指定的(de)結構化(huà)假設,并≈¥↑通(tōng)過假設檢驗來(lái)研究經濟機(jī)制(zhì)¶♠。在簡化(huà)形式的(de)多(duō$"λ↓)因子(zǐ)模型和(hé)機(jī)器(qì)學φ✔習(xí)預測模型出現(xiàn)之前, ±傳統的(de)實證資産定價分(fēn)析範式通(βε£tōng)過嚴格約束的(de)預測模型來(®$lái)研究價格。其中約束形式包括(i)特定的(de)函數(s×$hù)形式以及擾動項分(fēn)布,和(hé)(ii)被∞✘允許納入到(dào)條件(jiàn)信息集的(∞∏de)變量十分(fēn)有(yǒu)限。這(zhè)些(xiē)模型的(d®¥e)泛化(huà)能(néng)力很(hěn)差,表現(xiàn)★©"在它們無法解釋超出模型假定的(de)狹窄範圍♠✔∑或超出訓練數(shù)據集之外(wài)的(de)資産價格行(xíng)為(w>♣èi)。由于這(zhè)一(yī)看(kàn)法早已深入人πδ(rén)心,人(rén)們幾乎從(cóng)不(bù∏γ)考慮這(zhè)類完全指定的(de)結構資産定價模型Ω→在樣本外(wài)的(de)表現(xiàn)。₩'
另一(yī)種是(shì)“預測模型”文(wén)化(huà),它最看(kàn∑≥)重統計(jì)方面的(de)解釋力,且其發展主要(yà±§γo)得(de)益于早先建立的(de)結構模型無法有(y¥♦ǒu)效解釋實證數(shù)據。一(yī)旦能(néng)夠産生(shēng$€'≥)更加有(yǒu)意義且穩健的(de)數(βλ®shù)據拟合結果,哪怕模型設定和(hé)經濟學理(βπlǐ)論之間(jiān)缺乏明(míng)确的(dε©e)關聯,這(zhè)類模型也(yě)能(néng)夠被預♦♥÷測模型文(wén)化(huà)所接納。除了(le)自(z≥£ì) 1990 年(nián)代以來(lái)主導實證金(jīn ±★)融研究的(de)簡化(huà)形式模型外(wài),迄今為(wèi)≥止的(de)金(jīn)融機(jī)器(q€≥ ì)學習(xí)研究也(yě)完全符合這(zhè)種文(w λén)化(huà)。
在經濟研討(tǎo)會(huì)上(shàng),聽(tīng)衆、討(t∏"✔ǎo)論者和(hé)審稿人(rén)不(bù)時(shí)♥Ω★♦對(duì)統計(jì)預測研究抛出“欠缺經濟學”的(de)指責。這(zhè)☆"∏↕種批評常常是(shì)錯(cuò)誤的(de),而我們應≤β當防止它過度貶低(dī)金(jīn)融機(jī)器(qì)學習(xí)的×§♣γ(de)發展。我們不(bù)應忽視(shì)即使是(shì) φ最純粹的(de)統計(jì)建模應用(yòng)在金(jīn)融學中也γ<←£(yě)扮演著(zhe)重要(yào)的≤$(de)經濟角色。和(hé)傳統的(de)進行(xíng)結構假設©↑→檢驗的(de)計(jì)量經濟學相(xiàng)比,相(xiàn✘εg)對(duì)無結構的(de)預測模型的(de)經濟重要(yào)性相≈©§σ(xiàng)當,這(zhè)兩者隻是(shì)扮演了(le)不(bù)同γ≥•的(de)科(kē)學角色。假設檢驗通(tōng)過探究特α¶ ♣定的(de)機(jī)制(zhì)來(lái)♥$學習(xí)經濟學。然而,檢驗理(lǐ)論機(jī)制δ (zhì)并非經濟學的(de)全部。無理←π≤(lǐ)論的(de)(我們想不(bù)到(dào)更→ ₩好(hǎo)的(de)術(shù)語)預↔∏測模型所觸及的(de)實證領域更加廣泛,且能(nδ$β¥éng)夠描繪出全新的(de)實證事(shì)實;基于這(zhè)些(x↕☆₩↔iē)事(shì)實,人(rén)們能(néng)夠提出★÷新理(lǐ)論并且通(tōng)過假設檢驗來(lái)研δ✔®₩究其背後的(de)機(jī)制(zhì)。這(zh →φè)兩種形式的(de)實證研究 —— 精确的(de)檢驗和(hé¶♦)粗略的(de)探索 —— 在科(kē)學進步的(σ∑de)庫恩過程中發揮著(zhe)互補的(d₽£•e)作(zuò)用(yòng)。
再回到(dào)資産定價研究的(de)核心問(wèn)題:資産的(Ω✘₹de)風(fēng)險溢價到(dào)底由什(shén)麽決定?即使♣$≈λ能(néng)準确地(dì)觀測到(dào)預期收益率,我₽♠©≥們仍然需要(yào)理(lǐ)論來(lái)解釋它們的(de)行(x ₩íng)為(wèi),以及需要(yào)通(tōng)過實證研究來(l₹Ω¥ái)檢驗這(zhè)些(xiē)理(lǐ)論。然而,我們并不(₩¥≈bù)能(néng)觀測到(dào)風(fēng)險溢價,此外(wài)準确↑₩£地(dì)估計(jì)它們也(yě)難如(rú)登天®φ。機(jī)器(qì)學習(xí)在衡量風(fēng≈≈®<)險溢價方面取得(de)了(le)一(yī)定的(de)進展,有(yǒu)♣✘↕助于人(rén)們提出更好(hǎo)的(de)理(lǐ¥✘&÷)論來(lái)解釋決定收益率行(xín©✔g)為(wèi)的(de)經濟機(jī)制(zhì)。
拓展已有(yǒu)實證研究疆域的(de)一≥(yī)個(gè)重要(yào)好(hǎo)≥γ ≠處是(shì),哪怕人(rén)們尚不(bù)能(néng)參透隐藏在新實>♠★證發現(xiàn)背後的(de)經濟機(jī)制(zhì),經濟參與者 —$ε±— 尤其是(shì)金(jīn)融市(shì)場(ch§&$ǎng)參與者 —— 也(yě)總能(néng)從(cóng)更多(✘ duō)的(de)實證發現(xiàn)中εε¥ 受益。一(yī)直以來(lái),預測模型文(wén)化(hu'® ↔à)的(de)傳統是(shì)以幫助投資者、消≤♣費(fèi)者以及政策制(zhì)定者做(γ$zuò)出更好(hǎo)決策為(wèi)目的(de)而展開(kā↕≈i)研究。改進的(de)預測能(néng)夠π>™為(wèi)經紀參與者提供關于狀态依賴分(fēn)布的(de)更準确描述Ω÷。
總的(de)來(lái)說(shuō),經濟學是(shì)一(•₽αyī)個(gè)應用(yòng)領域。而預測模α÷型文(wén)化(huà)的(de)經濟學恰恰體(tǐ)現(xi<λ$àn)在其能(néng)夠提高(gāo)預測能(n×β€↓éng)力。一(yī)旦具備更好(hǎo)©<©<的(de)預測 —— 即對(duì)經濟機(jī)會(huì)集的(de)更準α★↑确的(de)評估 —— 經濟主體(tǐ)便λ≥能(néng)夠在分(fēn)配稀缺資源時(shí)更好(hǎo)地(dì)權€←衡成本和(hé)收益。這(zhè)提高(gāo)了(le)♦<≠"社會(huì)的(de)福利水(shuǐ)平。在投資組合優化(huà)σ∞問(wèn)題中,這(zhè)一(yī)點顯得(de)尤為(wèi)突出。我們™™→'也(yě)許不(bù)能(néng)總是(shì)理(lǐ)解模型通¶$↔(tōng)過什(shén)麽經濟機(jī)制♦∞&₽(zhì)提供了(le)更好(hǎo)的(de)收益率或風(fēng)險預測;ε¥✔™但(dàn)如(rú)果它做(zuò)到(dβ©σ←ào)了(le),它就(jiù)會(huì)提高(gāo)投資者的(de)效用ε§(yòng),因此它在經濟上(shàng)是(shì)重要(yào)的("≈♠₩de)。
Breiman 對(duì)結構假設檢驗文(wén)化(huà)的(de♠&♠)主要(yào)批評是(shì):
當通(tōng)過數(shù)據拟合來(lá≠÷↑λi)确定模型、并通(tōng)過模型做(zuò)出 ©定量結論時(shí):這(zhè)些(xiē)結論是(shì)關于模★型的(de)機(jī)制(zhì),而不(bù)是(shì)關于真實世界的(d♠•<✘e)機(jī)制(zhì)。一(yī)旦≈≤≠模型不(bù)能(néng)很(hěn)好(hǎo)地(dì)♣♠反映真實世界,那(nà)麽通(tōng)過模型得(de)出的(de)結論便可•∏(kě)能(néng)是(shì)錯(cuò)誤的(de)。
我們并不(bù)将上(shàng)述觀點視™¥≤(shì)為(wèi)對(duì)結構建模的(de)批判 —↑→— 畢竟結構建模仍然是(shì)實證金(jīn)融研↔≈β究的(de)基礎 —— 而是(shì)将它視(shì)為(wèi)對(duìε♦>)使用(yòng)預測模型的(de)辯護。當然,β♥将兩種文(wén)化(huà)完全對(duì)立開(kāi)來(lái)同樣是 ♥(shì)不(bù)可(kě)理(lǐ)喻¶→的(de)。學術(shù)研究往往二者兼顧且需要(yào)利用(yòng✘∞π)諸多(duō)工(gōng)具,研究者們也(yě)并非被劃分(fēn)₹☆¥到(dào)不(bù)同的(de)意識形态陣營(每個(gè)陣營是>σ(shì)同質的(de))。兩種文(wén)<≠¶化(huà)在經濟上(shàng)都(dōu¥≈)很(hěn)重要(yào)。Breiman 鼓勵人(• $rén)們考慮靈活的(de)乃至是(shì)非參數(shù)₹×化(huà)模型,以更好(hǎo)的(de)了(le)解經濟機(jī& σ)制(zhì):
模型的(de)目的(de)是(shì)獲取關于因變量和(hé)自(≠↓$δzì)變量之間(jiān)關系的(de)有☆€©₽(yǒu)用(yòng)信息。可(kě)解&≈α€釋性是(shì)獲取信息的(de)一(yī)種方式。但(dàn)是(s•↑↑hì),并非隻有(yǒu)簡單的(de)模型才☆♥ ×能(néng)提供關于二者之間(jiān)關系的(de)✘δ↑φ準确信息;同樣也(yě)并非隻有(yǒu)(結構≠<δ)數(shù)據模型才能(néng)實現(xiàn)✔ 上(shàng)述目标。
預測模型是(shì)理(lǐ)解機(jī)制(zhì)的(de)第一(yī)× ☆步。此外(wài),結構建模也(yě)可(kě)以直接從(cóng$ <)機(jī)器(qì)學習(xí)中受益,而這(zλ₩hè)種受益并不(bù)以犧牲有(yǒu)針對(duì)性的(de)假¥≈≤ 設檢驗或其特定的(de)經濟機(jī)制(zhì)為(wèi)前提♠ε✘。到(dào)目前為(wèi)止,機(jī)器(> qì)學習(xí)更多(duō)地(dì)出現(xiàn)在金(ε♥δjīn)融經濟學的(de)預測模型文(wén)化(huà)中。然而很(hěn)δ ≈重要(yào)的(de)一(yī)點是(sh×±πì)要(yào)認識到(dào),對(duì)于結構假設檢驗文(wén)化(α→huà)而言,它同樣是(shì)一(yī)個(gè)強大(dà)的(de)工( δ¥gōng)具(這(zhè)是(shì)未≤↔↕來(lái)金(jīn)融機(jī)器(qì)學習(₹₹®∏xí)研究的(de)一(yī)個(gè)重要(yào)方向)。當然€>±,對(duì)于一(yī)個(gè)僅僅建立于“無理(l®&ǐ)論測量”(Koopmans 1947)之上(shà ♦™σng)的(de)研究方式來(lái)說(shuō),如(rú)↔'β果我們同時(shí)通(tōng)過經濟學理(lǐ)論以₽♠及深入理(lǐ)解 Lucas (1976) 批判來(lá"☆λγi)思考數(shù)據,将會(huì)使它Ω¶發揮更大(dà)的(de)作(zuò)用(yòng)。同↔ 樣,一(yī)個(gè)僅通(tōng)過現(xiàn)有(y©δ♣ǒu)經濟模型解釋數(shù)據的(de)研究方式也≥≥(yě)很(hěn)可(kě)能(néng)會(huì)忽視(shì)掉意•α$₹想不(bù)到(dào)、但(dàn)經濟上(®₩shàng)非常重要(yào)的(de)統計(jì)模式。
Hayek (1945) 研究了(le)分(fēn)散化(huà)信息對(du"• ↓ì)資源配置的(de)經濟影(yǐng)響。關于如(rú)何實現§♥₩∞(xiàn)有(yǒu)效的(de)經濟秩序的(de)核心問(wèn)題,≈₹$他(tā)指出:
如(rú)果我們掌握了(le)所有(yǒu)相(xiàng"☆•)關信息,如(rú)果我們可(kě)以從(có←>ng)給定的(de)偏好(hǎo)系統出發,如(rú)果我們掌握了(lᮀ→e)可(kě)用(yòng)手段的(de)完整知(zhī)識,那(nà)麽剩✔下(xià)的(de)問(wèn)題就(jiù)純粹是(shì)邏輯問(wè$↕¥n)題……然而,這(zhè)顯然不(bù)是(shì)÷ €社會(huì)面臨的(de)經濟問(wèn)題。&φ ↓人(rén)們提出的(de)經濟計(jì)算(suàn)雖然是(shì"≤Ω&)解決社會(huì)經濟問(wèn)題的(de)重要(yào)步φ♣±驟,但(dàn)尚未就(jiù)該問(wèn)題給出答(dá)案。這(zh☆☆è)其中的(de)原因是(shì),經濟計(jì)'₩$算(suàn)的(de)起始數(shù)據是β≥←β(shì)從(cóng)整個(gè)社會(huì)收集的(de)所有(yǒuπ♥)相(xiàng)關數(shù)據,沒有(yǒu)哪個(gè)人(rén)或☆↔φ 者單個(gè)機(jī)構能(néng)完全獲×☆♠得(de)并理(lǐ)解所有(yǒu)的(de)數(shù)據以及數₹♣α₩(shù)據變化(huà)所帶來(lái)的(de♣•☆)經濟影(yǐng)響(譯者注:在經濟領域,這(zhè)個(gè)觀點被廣泛接受。這(zhè)也φ♥≤(yě)是(shì)為(wèi)什(shén)麽我們需要(yào)使用(yò'€ng)統計(jì)模型,以便從(cóng)大(dà)量多(duō)樣的(>∑♠₩de)數(shù)據中抽取有(yǒu)用(®↑÷yòng)的(de)信息,并嘗試預測和(hé)理(lǐ©¥∏)解經濟現(xiàn)象)。
雖然 Hayek 主要(yào)關注的(de)是(shì)分(fΩπ♦₽ēn)散式計(jì)劃的(de)優點,但&(dàn)他(tā)的(de)陳述也(yě)适用(yòng)于一$Ω←(yī)般的(de)信息技(jì)術(shù),特别是(shì)預測技(jì¥₹ε&)術(shù)。讓我們大(dà)膽地(dì)從(φ✔♥cóng)統計(jì)學問(wèn)題視(shì)角重新解δ→讀(dú) Hayek 的(de)觀點:經濟主體(tǐ)在數(shù)據生(π±shēng)成過程(DGP)已知(zhī)時(shí)所能'>¶✘(néng)夠實現(xiàn)的(de)配置效率±÷,與其在必須估計(jì) DGP 時(shí)所能(néng)夠實現(xi→λàn)的(de)配置效率二者之間(jiān)存在差距。其中的♦ (de)第一(yī)個(gè)原因是(shì±¶)模型設定偏誤問(wèn)題,即我們不(α×∞©bù)能(néng)指望經濟主體(tǐ)正确地(α₩≤dì)設定統計(jì)模型。他(tā)們隻能(néng)♣✘使用(yòng)某種帶設定偏誤的(de)參數(shù✔λ)模型或非參數(shù)近(jìn)似模型。£&在任何一(yī)種情況下(xià),模型設定偏誤都(dōu)會(huì)導緻已α≥↑知(zhī) DGP 時(shí)的(de)最優配置(稱之為(w★≠♦èi)“第一(yī)最優解”)與由該模型得(de)到(dào)的(de)最優¥β配置(稱之為(wèi)“第二最優解”)之間(jiānφπ)存在差距。然而,由于我們必須通(tōng)過有(yǒu)限的(de)π ↓數(shù)據來(lái)估計(jì)模型,因此即便是(shì↕♦)第二最優解也(yě)隻是(shì)水(shuǐ€★↑)中望月(yuè)。這(zhè)就(jiù)引發了(le)由采樣波動導緻的(©φ∑←de)另一(yī)個(gè)差距。即使我≈<±φ們知(zhī)道(dào) DGP 的(♣≈≥↔de)函數(shù)形式,我們仍然需要(yào)估←≥¶計(jì)它,而估計(jì)中的(de)噪聲會♣₩(huì)導緻最終偏離(lí)第一(yī)最優解。再疊加模型設定偏誤問(wè↓♣↔₩n)題,我們實際上(shàng)隻能(néng)獲得→→(de)“第三最優解”的(de)配置,即來(lái)自(z λπì)一(yī)個(gè)誤設模型的(de)噪聲估計(jì)所産生(shēng)επ∏≤的(de)解。
如(rú)果我們能(néng)夠通(tōng)過使用(yò✔"±<ng)善于處理(lǐ)大(dà)量信息和(hé)數(s♠ε←hù)據集的(de)方法而獲得(de)改進的(d φe)預測,便可(kě)使縮小(xiǎo)前×↕÷¥文(wén)中提到(dào)的(de)差距(即 Hayek 提到(dào)©<的(de)第一(yī)最優資源配置這(zhè)一(yī)純粹的(d∑₹₹e)“邏輯問(wèn)題”和(hé)經濟主體(tǐ)能 ♣©(néng)夠實現(xiàn)的(de)第三最優現(xiàn)實✔"↕配置這(zhè)二者的(de)差距)成為(wèi)可(kě)能(né>γ∑™ng)。由于可(kě)學習(xí)性的(de)統計(jì)限制(zh£✘>₹ì)(Da, Nagel and Xiu 2022;Didisε<δ heim, et al. 2023),我們永遠(yuǎn)無法完全消除上∞≤(shàng)述差距。但(dàn)是(shì),φ♣強大(dà)的(de)近(jìn)似模型和(hé)巧妙的(de)正則化(h¶≠₩←uà)方法意味著(zhe)機(jī)器(qì)學習$§(xí)在經濟上(shàng)是(shì)重要(yào)的(de),而其重要( ±↓₩yào)性恰恰源自(zì)它能(néng)夠産生(shēng)更好(hǎoΩφ↕)的(de)決策。投資組合選擇問(wèn)題能(n← éng)夠很(hěn)好(hǎo)地(d✔™ì)說(shuō)明(míng)這(zhè)一γ✘→ (yī)點。如(rú)果一(yī)個(gè)遵循現(xiàn)代投資✘≠ש組合理(lǐ)論的(de)投資者知(zhī)道(dào↑<π)真實的(de)預期收益率和(hé)協方≥¶→差矩陣,那(nà)麽他(tā)隻需将它們套入到(dào) Markowitz 理(lǐ)論的(de)“邏輯”之中便能←↓(néng)夠得(de)到(dào)第一(yī)最優解。然而,¥≥與 Hayek 的(de)問(wèn)題類似,這(zhè™₩)并非現(xiàn)實世界中的(de)投資者所要(→•yào)處理(lǐ)的(de)問(wèn)題。相(xiàng)反,他(tā)&♦₽們的(de)問(wèn)題主要(yào)是(shì)一(yī)個(g♠αè)估計(jì)問(wèn)題(一(yī)類預測問(wèn)題>↔¥)。投資者的(de)目标是(shì)獲得(de)關于預期收益率和(hé)協方差&✘矩陣的(de)合理(lǐ)估計(jì),以便當他(t©→ā)們采用(yòng) Markowitz ↕$ 理(lǐ)論時(shí),能(néng)夠獲得(de)穩健的(de)樣₩ →→本外(wài)表現(xiàn)。一(yī)旦這(zhè)個(gè>♦↔)前提不(bù)成立,即缺少(shǎo)高(gāo)質量的(de)估計(jì)✔$Ω"值,Markowitz 的(de)最優解将₹♥¶會(huì)導緻災難性的(de)配置後果。這(zhσ₩è)一(yī)點已在很(hěn)多(duō)研究中得(de)到(dào)證>♥β實。
參考文(wén)獻
Breiman, L. (2001). Random fores≠γ£ts. Machine Learning 45(1), 5 – 32.
Chen, H., W. W. Dou, and L. Koga♥™n (forthcoming). Measuring “Dark M"→ ↔atter” in Asset Pricing Models. Journal of Finance.
Cochrane, J. H. (2005)λ£ . Asset Pricing: Revised Edition&♣. Princeton University Press. ↔
Da, R., S. Nagel, and D. Xiγ∏u (2022). The statist∞☆∏↕ical limit of arbitrage. Working paper.>×₽
Didisheim, A., S. Ke, B. T. Kelly, ←♦and S. Malamud (2023σ♠&). Complexity in factor pricing modβ₹¥els. Working paper.
Fama, E. F. (1970). Efficient ca≤¶pital markets: A review of theory≠© and empirical work. Journal of Finance 25 '(2), 383 – 417.
Gu, S., B. T. Kelly, and D.σ'π Xiu (2020). Empirical a✘ ™sset pricing via machine learniγσ↔ng. Review of Financial Stu∑"✔dies 33(5), 2223 – 2273.
Hansen, L. P. and S. F. Richard (19♠87). The role of conditioning inform♦¥γφation in deducing testable restr←↑ictions implied by dynamic asse©δt pricing models. Econometrica 55(3), 587 – 613.
Hansen, L. P. and K. Jγ©>. Singleton (1982). Generalized instr≤>≤umental variables estimation↕♣♦ of nonlinear ration λal expectations models. Econometrica 50(5), 1269 – 1286.
Hayek, F. A. (1945). The use of ₹∏knowledge in society. American Economic Review 35(4), 519 – 530.
Israel, R., B. Kelly, and T. J. MoskowiΩ↔ ∞tz (2020). Can Machines “Learn” F✘©β inance? Journal of Investment↓€✘§ Management 18(2), 23 – 36.
Koopmans, T. C. (1947). Measurem ent without theory. Review of Economics and Statisti&↓$cs 29(3), 161 – 172.
Lucas Jr, R. E. (1976). Econometri∑©↑c policy evaluation: A critiq€₹ue. In: Carnegie-Roche→εster Conference Seri₽"↕€es on Public Policy. Vol. 1₹γ←. North-Holland. 19 – 46.
Martin, I. W. and S. Nagel (2022). Ma♦γ λrket efficiency in the age of b>∞ig data. Journal of Financial Economics ×γε₽145(1), 154 – 177.
Mehra, R. and E. C. Pre∑∑Ω←scott (1985). The equity premiuσ↓§m: A puzzle. Journal of Monetary Economics 15(2), 145 – 161.
Samuelson, P. A. (1965).÷€∞ Rational theory of war≠±rant pricing. Industrial Management Review Ω£ 6(2), 13 – 39.
免責聲明(míng):入市(shì)有(yǒu)風(fēng)險,±β$₹投資需謹慎。在任何情況下(xià),本文(w↑•én)的(de)內(nèi)容、信息及數(shù)據或所表述的(de)★₩₽意見(jiàn)并不(bù)構成對(duì✔×)任何人(rén)的(de)投資建議(yì)。在任何情況下(xià),本文↓α(wén)作(zuò)者及所屬機(jī)構不(b'γ ù)對(duì)任何人(rén)因使用(yòng)本文"♣(wén)的(de)任何內(nèi)容所"≥引緻的(de)任何損失負任何責任。除特别說(shu•₩ō)明(míng)外(wài),文(wén)中圖表均直接或間α★(jiān)接來(lái)自(zì)于相(xiàng)應論文(wén),§λ僅為(wèi)介紹之用(yòng),版權歸原作(zuò)者和(hé)期刊所有§$(yǒu)。