
科(kē)技(jì)關聯度 (II)
發布時(shí)間(jiān):2022-10-26 | φ∏♦ 來(lái)∏<源: 川總寫量化(huà)
作(zuò)者:石川
摘要(yào):用(yòng)更先進算(suàn)法和(hé)數(shù)據打磨異象已$π成為(wèi)內(nèi)卷時(shí)代實證研究的(de) 無奈之舉。然而在協變量的(de)高(gāo)維數(shù)時(sh™αí)代,對(duì)單一(yī)異象的(de)精雕☆γ←細琢又(yòu)有(yǒu)多(duō)少(shǎ∏ o)價值?在另類數(shù)據應用(yòng)中,學界是(shì)否在越±§ ¶走越窄?
1
4 年(nián)前(whoa, time flies)¥δ,《科(kē)技(jì)關聯度》一(yī)文(wén)介紹了(le) Lee, et al.ε<✔ (2019)。該文(wén)指出公司之間(jiān)以專δ∏÷利類别重合度計(jì)算(suàn)的(de)科(∏↓♦kē)技(jì)關聯度(相(xiàng)似度)可(kě)以帶來©∞∞(lái)股票(piào)收益率之間(jiān)的(de)領先↔$"•—滞後關系,利用(yòng)它可(kě)以獲得(de)傳統因子(zǐ)無法解釋<ε的(de)超額收益。即便到(dào)了(le)今天,依然可(kě)以說(sh©₩¥uō)該文(wén)是(shì)一(yī)篇實證研究的(de)典範。今天的(de)題目是(shì)《科(kē)技(jì®σ)關聯度 (II)》。我想你(nǐ)大(d♥φà)概猜到(dào)了(le),是(shì)有(₹>×yǒu)人(rén)把計(jì)算(suàn)科(kē)技(jì)↓ 關聯度的(de)方法升級了(le),這(zhè)篇文(wén)章(zhāng∑©απ)就(jiù)是(shì) Bekkerman, ≤∞↕Fich, and Khimich (2022)。該≈♠文(wén)沒有(yǒu)使用(yòng)專¶♦利類别,而是(shì)直接對(duì)專利進行(xíng)文(wén×Ωσ)本分(fēn)析,通(tōng)過提取專π☆ε業(yè)術(shù)語并計(jì)算(suàn)其•÷重合度來(lái)描述公司之間(jiān)的(de)相(xiàng)似≥₹σ₹程度。不(bù)出意外(wài),升級版科(kē)技(jì)關聯度“≈δ打敗”了(le) Lee, et al. ®(2019)。這(zhè)體(tǐ)現(xiàn)在當↔≈±≠控制(zhì)了(le) Lee, et al. (2019) 的(↑€de)變量之後,新的(de)變量依舊(jiù)能(néngγ ☆)夠獲得(de)超額收益,而反之則不(b$λù)然。且實證結果指出,在 2000 年(niδλ¶án)之後,Lee, et al. (2019) 的✔∑€€(de)變量逐漸難以獲得(de)超額收益,而新的(de)π÷♣★變量則依然“生(shēng)機(jī)盎然”。
在學界如(rú)今內(nèi)卷的(de)現(xiàn)狀下(xià),♦'≠★用(yòng)更先進算(suàn)法和(hΩπé)數(shù)據打磨異象已成為(wèi)實證研究的(×∏εde)無奈之舉;而一(yī)旦使用(yòng)了(l★→'≈e)更先進的(de)算(suàn)法和(hé)→§♠數(shù)據,也(yě)就(jiù)十有(yǒuπα)八九能(néng)找到(dào)樣本內£∞π(nèi)更好(hǎo)的(de)超額收益φγσ≠。從(cóng)這(zhè)個(gè)角度而 ✔γ言,Bekkerman, Fich, and Khimich (Ω∑¥2022) 隻是(shì) follow the trend,并無特别之↓處。然而,該文(wén)的(de)一(yī)些(xiē)實證結果和(hé)討(t→™≤ǎo)論引發了(le)我關于此類領先—滞後關系®€<準另類數(shù)據的(de)一(yī)些(xi≤✔ē)思考。本文(wén)就(jiù)抛磚引玉
2
在我看(kàn)來(lái),Bekkerman, ↔¥®☆Fich, and Khimich (20÷φ22) 一(yī)文(wén)最重要(yào)的(de)實證結果(•β之一(yī))不(bù)是(shì)基于新變量的(de)₩ portfolio sort 或 Fama-MacBeth €←regression 來(lái)表明(míng)異象能Ω≥₽σ(néng)夠獲得(de)多(duō)麽顯著的(de)超額收益,而是(shì)∑≈× Table 2 Panel C。Table 2 Panel C 的(de)結果為(wèi)科(kē)技(jì<÷)關聯的(de)公司之間(jiān)存在的"$φ (de) economic connectio≈♠©βns 提供了(le)證據;隻有(yǒu) economic cγ£¥onnections 存在,基于科(kē)技(jì)關聯度構造的(de> <✔)異象才站(zhàn)得(de)住腳,否則它大(dà)概率隻是(™¥↕σshì)霧裡(lǐ)看(kàn)花(huā)。為(wèi)此,Bek•™☆kerman, Fich, and Khimi&δ ch (2022) 從(cóng)盈利和(hé)科(kē)技(jì)<≠創新兩方面出發研究了(le)焦點公司和(hé)關聯公司之間(jiān♦>)的(de)關系。以盈利為(wèi)例,該文(wén)研究了¶∞♥(le)焦點公司和(hé)關聯公司 ROA 同期♥±的(de)相(xiàng)關性,以及焦點公司
以 column (1) 中的(de)回歸結果為(wèi)例,$☆其因變量是(shì)焦點公司
可(kě)見(jiàn),無論是(shì)盈♠β利還(hái)是(shì)科(kē)技(jì)創新,焦點公✘π司和(hé)關聯公司同期都(dōu)有(yǒu)顯著的(de)正γλ相(xiàng)關,此外(wài)關聯公≠∞®司的(de)
3
該文(wén)另一(yī)個(gè)重要(yào)的(±£de)(且是(shì)讓我陷入深深思考的(de))實證結果是(shì₩∞φ>) Table 6 Panel C。在該表中,作(zuò)者将他(tā)們基于文(wén)本計(jì)算(s&↓uàn)的(de)科(kē)技(jì)關聯度♣✔$和(hé) Lee, et al. (2019) 基于∞®專利類别計(jì)算(suàn)的(de)科α•Ω"(kē)技(jì)關聯度進行(xíng)了(le)比對(duì),其♥✔ 中 Panels A 和(hé) B 分(fēφ÷ ♣n)别彙報(bào)了(le)兩種計(jì)算(suàn)方法的(deγ™σ₹)結果,而 Panel C 則基于兩種方法☆↕★對(duì)滿足條件(jiàn)的(de)股票(pi÷§ào)進行(xíng)了(le)細分(fēn)。Panel ♥C 中:
TS-text NOT TS-class 表示基ε€δφ于文(wén)本相(xiàng)似,但(dàn)≈¥ε≈基于類别不(bù)相(xiàng)似;
TS-text AND TS-class 表示基于文€π♦(wén)本相(xiàng)似,且基于類别相(xi→δ♠àng)似;
TS-class NOT TS-text 表示基于類别相(xiàng)σ₽似,但(dàn)基于文(wén)本不(bù)≠←≠相(xiàng)似。
除此之外(wài),作(zuò)者不(bù)僅考慮了(le) ful®₩l sample,還(hái)将整個(gè)樣本分(f§$☆∏ēn)成了(le)四個(gè)時(shí)間(jiān)區(qū)間(jiā→πΩn),以此分(fēn)析可(kě)預測性如(rú)何随時(shí)間(j¥♠↑±iān)發生(shēng)變化(huà)。這(zhè)四個₹≥≤&(gè)區(qū)間(jiān)為(wèi)1977 – 1986、19φΩ¶87 – 1999、2000 – 200←≥ 8 和(hé) 2009 – 2016。到(dào)此,給自(zì)己的(de)“坑”就(jiù)算(s uàn)是(shì)挖好(hǎo)了(le)。哦,不(bù)對(duì)÷₩→,是(shì)實證設定就(jiù)做(z♠™uò)好(hǎo)了(le)!在下(xià)面的(de)結果中,最有(yǒu)意思的(de)是(shì€βΩ)在 1977 – 1986 以及 1987 – 1999 這(zhè)兩個(g↓©è)區(qū)間(jiān),或統稱為(wèi) 2000 年(ni₹© €án)以前,TS-text NOT TS-class(文(wéβ↑n)本相(xiàng)似但(dàn)是(shì)類别不(↑₹bù)相(xiàng)似)并不(bù)能(néng)獲得(de)顯著的(de★♦)超額收益;反倒是(shì) 2000 以後,它迎✘β≤來(lái)了(le)大(dà)紅(hóng)€ ≈∞大(dà)紫的(de)黃(huáng)金(jīn)年(nián)代。
這(zhè)樣的(de)實證結果不(bù)禁讓人(r↓γ↓γén)大(dà)大(dà)的(de)疑惑σ α。Bekkerman, Fich, and Khimich₽← (2022) 對(duì)此的(de)解釋是(shì):199σα♠♥9 年(nián)之前,專利數(shù)據 ♦并沒有(yǒu)被數(shù)字化(huà),因✔此對(duì)投資者來(lái)說(shuōγ☆)可(kě)以認為(wèi)是(shì)不(bù)≠★β可(kě)得(de)的(de)。在 1999 ₹•年(nián)之後,專利數(shù)據被 $≈放(fàng)到(dào)了(le)互聯網上(shàng),極大(dà↕ )的(de)降低(dī)了(le)投資者獲取的(de)難度。他(tφ£φ£ā)們猜測這(zhè)就(jiù)是(shì) TS-tex≤σ t NOT TS-class 在 2000 年(nián)之前不(bù)好(h→★ǎo)使的(de)原因。看(kàn)完這(zhè)個(gè)解釋後我更加困惑了(le)。對(duì)于一(yī)個(gè)常規的(de)協變量(比如(rú)諸多(β duō) firm-characteristics),如(rú)∞π<果變量/數(shù)據背後代表的(de) economic co↕Ⱪnnections 存在,那(nà)麽它不(b₽✘©☆ù)應該受到(dào)數(shù)據是(shì)否對(duì)投資者£"可(kě)得(de)而影(yǐng)響,且當沒有(yǒu)投資者使¶ 用(yòng)的(de)時(shí)候(也(yě)就(jiù)更不(bù)存€σ在過度套利),這(zhè)種 connections 所帶來(lái)'♥♦>的(de)超額收益應該更高(gāo),而不(bù)∑π是(shì)消失(Linnainmaa and Roberts 20♦λ₩18)。也(yě)正因如(rú)此,AQR • <₩在 Buffett’s Alpha 一(yī)文(wén)中才發出“巴&£菲特才是(shì)真的(de)神,我們隻是(s₹∏®hì)事(shì)後分(fēn)析的(de)凡人(rén)”的Ω☆≥(de)感慨。
然而基于 TS-text NOT TS-clas£←π£s 的(de)科(kē)技(jì)關聯度怎麽就(jiù)不(bù)好(hǎoε"✔)使呢(ne)?是(shì)上(shàng)述認知(zhī)有(yǒu)問(₽δwèn)題,還(hái)是(shì)它并非一(yī)個(gè)常規的(d₽&e)協變量?是(shì)否存在另一(yī)種合理(lǐ)的(de)解→λ釋支持“專利數(shù)據在 2000 年★♥(nián)開(kāi)始變得(de)可(kě)得(de)導緻了(♥™le)該結果”這(zhè)種說(shuō)法?Here is the trick.(特别感謝(xiè)因子(zǐ)動物(∏wù)園園長(cháng)對(duì)此的(de)討(tǎo)論。)科(kē)技(jì)關聯度(以及其他(tā)方法計(jì₽ →)算(suàn)的(de)各種花(huā)式相(xiàng)似©€度)本質上(shàng)是(shì)公司之間(jiā¥γn)的(de)關聯形成的(de)動量效應。邏輯上(s☆λ♠hàng)來(lái)說(shuō),是(shì)由于投資者注∏意力有(yǒu)限,沒有(yǒu)注意到(dào)隻有(yǒu)完全理(l λǐ)性的(de)投資者能(néng)認識到(dào)的(de)關聯(無論是("♣shì) Lee, et al. (2019) 還(hái)是(shì)&✘σ這(zhè)篇都(dōu)有(yǒu)這(zhè)方面的(de÷<↔)充分(fēn)討(tǎo)論),所以導緻信息擴散緩慢(màn),進而導緻焦點∑π¥±公司的(de)關聯公司的(de)曆史股票(piào)收益率能(né♠'¶♦ng)夠預測其股票(piào)收益率。
接下(xià)來(lái),重點來(lái)了(le)!這(zhè)裡(lǐ)的(de)前提是(shì)信息擴散緩慢(màn)的<>₩π(de)原因是(shì)投資者注意力不(bù)₹足,而不(bù)是(shì)投資者完全完全意識不(bβ±↑€ù)到(dào)關聯。注意力不(bù)足意味著(zhe)投資者未來(lái)能(×€✘néng)認識到(dào)關聯,因而會(huì)有(✔λ®yǒu)信息的(de)進一(yī)步擴散和(hé)♥λ關聯動量。而後者意味著(zhe)投資者壓根就(jiù)看(kàn)不(b×"®ù)到(dào)關聯的(de)存在,因此也(yě)就(jiù)' ≈沒關聯動量效應了(le)。在這(zhè)個(gè)解釋下(xià),一(yī)切似÷÷乎能(néng)說(shuō)通(tōng)了(le)。在 2000"→ 年(nián)以前,當專利數(shù)據還(hái)沒有(yǒu)廣±↔ ♠泛可(kě)得(de)的(de)時(shí)候,投資者¶←↕根本不(bù)知(zhī)道(dào)這(zhè)類數(shù)據存在,因此$∏什(shén)麽有(yǒu)限注意力以及由此導緻的(de)₹≤公司間(jiān)動量也(yě)就(jiù)無從(cóng)談起。合理(lǐ)嗎(ma)?也(yě)許吧(ba),但(dàn)很(hěn)難¥♣±說(shuō)一(yī)點不(bù)牽強。這(zhè)似乎®₩在傳遞著(zhe),所有(yǒu)公司間( × ®jiān)的(de)花(huā)式動量(各種領先—滞後關 ®γ™系)存在的(de)前提都(dōu)有(yǒu)兩點≥∑✔:1. 投資者意識到(dào)了(le)數(shù)據的(de)存♥±✔≥在;2. 由于投資者有(yǒu)限注意力,因此沒有(yǒu)充分(fēn)©αλ利用(yòng)數(shù)據,導緻信息緩慢(màn)擴€δ散。它給我一(yī)種“觀測到(dào)數(shù)據,就(jiù)有(yǒ∑©÷©u)
4
本文(wén)的(de)最後討(tǎo)論一(yī)下₹≥§(xià)升級版科(kē)技(jì)關聯度擊敗了(le)&↔∏老(lǎo)版這(zhè)類現(xiàn)象。這($♦×↔zhè)并非科(kē)技(jì)關聯度異象特有(yǒu)的≥♠βφ(de)現(xiàn)象,而是(shì)會(huì)™✔出現(xiàn)在任何異象上(shàng)。随→γ 著(zhe)構造數(shù)據的(de)豐富和(hé$)構造手段的(de)複雜(zá),叠代後的(deα•)異象一(yī)定會(huì)在實證中打敗老(lǎoπ"♦π)的(de)異象。但(dàn)是(shì),在協變量的(de)高(gāo)維數(shù)←∏φ時(shí)代,精雕細琢一(yī)個(g©∞è)異象又(yòu)有(yǒu)多(duō)少(₩shǎo)實踐價值(發 paper 的(de)學術☆£♠(shù)價值自(zì)然是(shì)有(yǒu))?如(r↔ ú)果另類數(shù)據隻是(shì)用(yòng)來(lái)→ '★打磨異象而非揭示出更多(duō)公司之間(jiān)的(de) eco ≈nomic connections,那(nπ<±à)麽人(rén)們在這(zhè)條路(lù)上(sh€•àng)是(shì)否越走越窄?(這(zhè)也(yě)是(shì)為↕(wèi)什(shén)麽我認為(wèi) Table 2 Panel C →₽才是(shì) Bekkerman, FicΩ™δh, and Khimich (2022) ♥≈ 的(de)點睛之筆(bǐ)。)
對(duì)于升級版科(kē)技(jì)關聯度在 2000 年(nián)之ε☆後十分(fēn)有(yǒu)效,但(dàn)基•★×£于專利類别的(de)關聯度卻逐漸失效的(de)結果,我們可↑•Ω☆(kě)以從(cóng)兩方面來(lái)解讀≈α™×(dú)。第一(yī)個(gè)就(jiù)是(shì)投↕¥₹資者有(yǒu)限注意力的(de)問(wèn)題(當₩"然,我們假設投資者已經意識到(dào)了(le)數(shù)據的(de)存在≠₩!)。第二方面,我想到(dào)的(de)是(shì) Martin and '≈₩βNagel (2022) 以及 Nagel ("↑2021) 中提到(dào)的(de)投資者學習(xí)問(wèn♠✘)題。比起專利類别,基于文(wén)本計(jì)>&算(suàn)相(xiàng)似度要(yào)更加複雜(zá≠β© ),即投資者獲取和(hé)處理(lǐ)專利數(shù)據的(de)成本更Ωα"加昂貴,因此大(dà)多(duō)投資者會(huì)σ§λ在為(wèi)公司估值時(shí)忽略這(zhè)方面的(de)信息。這(™±®♥zhè)将導緻他(tā)們使用(yòng)過度稀疏的(de)估值模型,進而造成₽<樣本內(nèi)和(hé)樣本外(wài×±)收益率可(kě)預測性。
毫無疑問(wèn),另類數(shù)據打開(k☆→āi)了(le)量化(huà)投資的(de)新篇章(zhāng),但(✘φ↓dàn)是(shì)當我們在使用(yòng)這(zhè)類基于新數(shù÷®δ')據以及新技(jì)術(shù)挖出的(de)協變量時(shí),也(y§<ě)應該對(duì)其背後獲得(de)超額收益的(→★de)原因有(yǒu)更加深刻的(de)思考。最後,讓我以 N ' agel (2021) 中的(de)一(yī)段話(huà)結束本文₽α(wén)(截圖來(lái)自(zì)我和(hé)王老(lǎo)師(shī↑ )翻譯的(de)中文(wén)版《機(jī)器(qì)學習(xí)與資産定價》)。
參考文(wén)獻
Bekkerman, R., E. M. Fich ©≤ , and N. V. Khimich (2022). The e >₽ffect of innovation similarity on₩< asset prices: Evidenβ♥ce from patents’ big data. Review of Asset Pricing Studies forthcoming.
Lee, C. M. C., S. T. Sun, R. Wang, δ ×and R. Zhang (2019). Technolγ₽ogical links and predictaφ↔÷ ble returns. Journal of Financial Economics 132(3), 76 – 96.
Linnainmaa, J. T. and M. R. Rober♦&δ★ts (2018). The history of the cr¶oss-section of stock returns. Review of Financial Studφ±→ies 31(7), 2606 – 2649.
Martin, I. W. R. and S. Nagel &♦(2022). Market efficiency in∑¥ the age of big data. Journal of Financial Economics 145(1), 154 – 177.
Nagel, S. (2021). Machine Learning in Asset Pricin&≠g. Princeton, NJ: Princeton Unσ≈÷iversity Press.
免責聲明(míng):入市(shì)有(yǒu)風(fēng)險♦ ,投資需謹慎。在任何情況下(xià),本文(wén)的(de)內(nèi"₹←)容、信息及數(shù)據或所表述的(de)意見(jiε♦∏àn)并不(bù)構成對(duì)任何人(rén)的(d≤₹e)投資建議(yì)。在任何情況下(xià),本文(wé≈&n)作(zuò)者及所屬機(jī)構不(bù)對(duì)任何§<×人(rén)因使用(yòng)本文(wén)的(de)任何內(nè©σ✘ i)容所引緻的(de)任何損失負任何責任。除特别說(s∑©huō)明(míng)外(wài),文(wén)中圖表均直接或間(ji↔♥©ān)接來(lái)自(zì)于相(xiàng) ≠¶"應論文(wén),僅為(wèi)介紹之用(yò♦©↕ng),版權歸原作(zuò)者和(hé)期刊所有(yǒu)。§₩π