
量化(huà)選股 101
發布時(shí)間(jiān):2016-09-27 | <> 來(lái)源: 川總寫量化(huà)
作(zuò)者:石川
摘要(yào):本文(wén)介紹基礎量化(huà)選股模型。
1 Alpha 收益率
一(yī)般認為(wèi)股票(piào)的(de)收益率分(fēn ₩≈)為(wèi) alpha 和(hé) beta 兩±£個(gè)部分(fēn)。每支股票(piào)的(de) bet™&₩₹a 收益率來(lái)自(zì)市(sh<↔×♠ì)場(chǎng),而 alpha 部分(fēn)則是(shì)δ÷它的(de)超額收益率。買股票(piào)就(γ≥¶jiù)是(shì)買公司,每個(gè)✘♦→基金(jīn)經理(lǐ)都(dōu)在努力尋求有(yǒu)™±σ↕真正 alpha 收益率的(de)優秀股票(piào)。大(dà)型的(de)公募基金(jīn)和(hé)券商有(y>↑↓≤ǒu)足夠的(de)人(rén)力和(hé)财力來(lái)組建自(zì)己¶的(de)行(xíng)業(yè)專家(jiā)團隊,還(hái)有(yσ★ǒu)很(hěn)多(duō)基金(jīn)經理(lǐ)絞盡腦(¶₽nǎo)汁成為(wèi)上(shàng)市(shì)公司董秘肚子(×α¶γzǐ)裡(lǐ)的(de)蛔蟲,以希望能(néng)挖掘優秀₩×'的(de)個(gè)股。但(dàn)小(xiǎo)型的(de®♣)私募或者資管公司如(rú)果沒有(yǒu<₽∞&)能(néng)力來(lái)構建團隊呢(ne)&✘↓,量化(huà)選股就(jiù)成為(wèi)一(yī)個•β✔★(gè)低(dī)成本的(de)必然選擇。本文(wén)介紹基本量化(huà)選股Ω&方法。
2 量化(huà)選股模型
量化(huà)選股的(de)核心是(shì)找到(d®ào)能(néng)挖掘出股票(piào)超額收益率的(d←e)選股因子(zǐ)(因此這(zhè)種方法稱為(wèi)多(duō)因子(zǐ)選股),這(zhè)些(xiē)因子(zǐ)可(kě)以是(shì)基本→→面的(de)财務因子(zǐ)或者是(shì)技(jì)術(sh÷ ×ù)面的(de)因子(zǐ);黑(hēi)貓白(bái)貓,抓到(dào↕ )耗子(zǐ)就(jiù)是(shì)好(hǎo)貓。确定有(yǒ•∏♦u)效因子(zǐ)以後,用(yòng)這(zhè)些(xiē)因子(zǐ)給每'☆個(gè)股票(piào)打分(fēn),選出得(de)分±γ(fēn)高(gāo)的(de)那(nà)些☆(xiē)股票(piào)進行(xíng)投資。選股模α×∑型每隔一(yī)段時(shí)間(jiān)就(j←↔↑iù)會(huì)重新運行(xíng)一(yī)次,以确定新的>>(de)股票(piào)池子(zǐ)。這(zhè)麽做(±✘zuò)的(de)原因主要(yào)有(yǒu)兩個(gè):
1. 不(bù)管是(shì)财務因子(β<zǐ)還(hái)是(shì)技(jì)術(shù)因子(zǐ),¶≤任何一(yī)個(gè)因子(zǐ)都(dōu¥'≤≥)很(hěn)難持續有(yǒu)效。因此必須定期對(duì)因子(zǐ)的(de)選股小(xε®$✘iǎo)姑進行(xíng)評估,剔除逐漸失效的(×≤de)因子(zǐ),選入新的(de)有(yǒu)效的(de)因子(zǐ)。
2. 股模型中用(yòng)到(dào)了(le)大(d♥↔à)量的(de)财務因子(zǐ),因此當上(shàng)市(shì< )公司披露新的(de)财報(bào)時(s↕λhí),需根據新的(de)因子(zǐ)數(shù)據ε 重新運行(xíng)。
基于上(shàng)述原因,量化(huà)選股模型一>≠✘(yī)般在公司披露财報(bào)的(de)時(shí)點更新$∑股票(piào)池子(zǐ)。量化(hu★₽∑§à)選股模型的(de)流程圖如(rú)下(xià)圖± &↔所示。下(xià)面一(yī)一(yī)簡要(yào)說(shuō)明('±míng)。
2.1 确定備選因子(zǐ)
從(cóng)大(dà)類上(shàng)說(shuō),因子(zǐ)™&主要(yào)包括基本面和(hé)技(jì)術(shù)面✘÷±≥兩類。基本面因子(zǐ)是(shì)和(hé)上(shàng££↕)市(shì)公司财務相(xiàng)關•↑™的(de)因子(zǐ),又(yòu)可(kě)以細分(fēn)為£€(wèi)盈利因子(zǐ)(如(rú) ↔δ∞ ROE、ROA 等)、估值因子(zǐ)(如(rú) PE、PB 等)、規¶€模因子(zǐ)等;技(jì)術(shù)面因子(zǐ)主要(✔σ±yào)是(shì)和(hé)股票(piào)量價相(xi↔✔ ☆àng)關的(de)因子(zǐ),可(kě)以分(fēn)為(wè™÷i)波動類、動量類和(hé)反轉類。除了(le)這(zhè)兩類主要(yàλ•€βo)因子(zǐ)外(wài),還(hái)可(kě)以考慮其他(tā)一(♦∞§yī)些(xiē)因子(zǐ),包括券商評級、市(shì)場(chǎng)情β₩緒等。
2.2 計(jì)算(suàn)每個(g¥§←γè)因子(zǐ)的(de)選股能(néng)力♥•¶
計(jì)算(suàn)每個(gè)因子(zǐ)的(de£→)選股能(néng)力是(shì)量化(h★€♥uà)選股模型的(de)核心。我們以 ROE 為(wèi)例說(shuō)明(míng)這(zhè)個'σ✘(gè)過程。
第一(yī)步,因子(zǐ)預處理(lǐ):首先對(duì) ROE 因子(zǐ)進行(xíng)預處理(lǐ)≠≤$,這(zhè)裡(lǐ)可(kě)以去(qù)掉一(yī)些(ε€xiē) ROE 取異常值(極大(dà)或極小γ¥∞(xiǎo)值)的(de)那(nà)些(xiē)股票(piào),它↔☆們可(kě)能(néng)對(duì)選股造成幹擾;另外(w✔σ'₹ài),可(kě)以對(duì)剩餘股票✘'εφ(piào)的(de) ROE 進行(x ≤↔★íng)歸一(yī)化(huà)處理(l✘Ωδ©ǐ)。
第二步,将股票(piào)排序:預處理(lǐ)之後,按照(zhào)因子(zǐ)δ↕的(de)業(yè)務邏輯給所有(yǒu)個( &★gè)股排序。由于 ROE 是(shì)盈利因子(zǐ),因此其業(y×♠∞è)務邏輯是(shì) ROE 越大(dà),上(shàn≠€∑g)市(shì)公司的(de)價值應該越好(hǎo),其股票(piào)<>的(de)超額收益率就(jiù)應該越高(gāo)。因此,∏>↓按照(zhào) ROE 的(de)大(dà'¥§₩)小(xiǎo)給個(gè)股排序。
第三步,構造投資組合:排序後,選出排名前 1/5 的(de)股票(piào) π★做(zuò)多(duō),選出排名後 1/5 的(d&×'™e)股票(piào)做(zuò)空(kōng)(假設可≈←₩¶(kě)以做(zuò)空(kōng)),這(zhè)就( β jiù)是(shì)我們當期的(de)投資組合。注意,你(n•¥ǐ)當然也(yě)可(kě)以選前後 1/10,而非 1/5。
第四步,計(jì)算(suàn)投資組合收益率:計(jì)算(suàn)回測區(qū)間(jiān)內(nèiπ¶)內(nèi)該因子(zǐ)的(de)選股效果。在實證中,随著(zhe✔✔®δ)财報(bào)數(shù)據的(de)逐步披露,我們會(huì)得(de<<∑)到(dào)新的(de) ROE 數(shù)據。每次得↕←•(de)到(dào)新的(de) ROE,重新對(duì)股票(pαΩiào)排序并構建當期的(de)投資組合。這(zhè)也(•©•yě)被稱為(wèi)投資組合再平衡。
第五步,檢驗收益率:檢驗收益率均值是(shì)否顯著大(dà)于零,以此作(zu±£♥ò)為(wèi)評價因子(zǐ)的(de)基準。
2.3 選出最好(hǎo)的(de) n 個(gγ₩è)因子(zǐ)并賦權
由于備選的(de)因子(zǐ)可(kě)以有(yǒu)上(shàng)↕•♣∏百個(gè),因此我們必須擇優選出 n 個(gè)有(yǒu λ★)效的(de)因子(zǐ)。這(zhè)裡(lǐ)主要(yào)有(yǒu)$兩個(gè)方法:
1. 設定因子(zǐ)選股能(néng)力阈值,如(rú)果一(yī)個(gè)因子(zǐ)的(de)選股能(nén™€ ≈g)力高(gāo)于該阈值則選為(wèi)有(yǒu)效因子(z≠<÷ǐ),因子(zǐ)的(de)個(gè)數(shù) n 不(bù)固定。
2. 設定固定的(de)因子(zǐ)個(gè)數(shùλ¶') n(n 一(yī)般取 10 到(dào) 20 個(&§←©gè)之間(jiān))。将所有(yǒu)因子(zǐ)按其選股能(néng)≥× ↔力從(cóng)高(gāo)到(dào)低(dī)排☆♣£序,選出前 n 個(gè)因子(zǐ)作(zuò≠'≈)為(wèi)有(yǒu)效因子(zǐ)。
選出 n 個(gè)因子(zǐ)後,為(wè ¥i)這(zhè)些(xiē)因子(zǐ)賦權,以便最後一(y☆ ī)步中給個(gè)股打分(fēn)。在賦權之前,值得(de)一(yī)↕↑€提的(de)是(shì),選出的(de)✘≤' n 個(gè)因子(zǐ)之間(jiān)可(παkě)能(néng)存在多(duō)重共線性。換句話(huà)說(shuō),有(yǒu)些(xiē)≤♣因子(zǐ)之間(jiān)可(kě)能(néng)存在很(h↔≈ěn)高(gāo)的(de)相(xiàng)關性,這(zh∑α§è)對(duì)于選股是(shì)不(bù)利的(de),應該給€予考慮。(我們将在第 4 節說(shuō)明(míng) €多(duō)重共線性的(de)缺點。)賦λ↑權有(yǒu)以下(xià)兩種常規方法:
1. 等權,所有(yǒu)優選出來(lá∏i)的(de)因子(zǐ)一(yī)視(shì)同仁;因此每個(gè)因子(zǐ)的(de)權重是(shì) 1 或Ω≈者 1/n。
2. 正比于每個(gè)因子(zǐ)的(de)選股能(néng)力賦權;因此每個(gè)因子(zǐ)的(de)權重等于“該因子(zǐ)的♠••φ(de)選股能(néng)力”除以“所有(yǒu)因子(zδ✔"✘ǐ)中最大(dà)的(de)選股能(néng)力”。
2.4 為(wèi)股票(piào)打分(fēn)
為(wèi)股票(piào)打分(fēn)分(φ¶fēn)為(wèi)兩步。第一(yī)步使用(yòng)每個(gè)因子(zǐ¶☆)對(duì)每支個(gè)股獨立打分( ✔ fēn),即用(yòng)選出的(de) n 個(gè)因子(zǐ)為<λ(wèi)個(gè)股打分(fēn)。對(duì)于每一(yεα¥ī)個(gè)因子(zǐ),按其業(yè) γ務邏輯對(duì)個(gè)股排序,并打分®♠₽δ(fēn)如(rú)下(xià):最好(hǎo)的(de) 10% 的(de$α)股票(piào)得(de) 10 分(fēn),次好(hǎπγo)的(de) 10% 的(de)股票(piào)的(de) 9 分(♥$fēn),以此類推,最差的(de) 10% 的(de)股票(pià→β©∑o)得(de) 1 分(fēn)。第二步為(w∏≠♣èi)計(jì)算(suàn)每支股票(piào)的(de)總分(fēλ∞n),即用(yòng)每支股票(piào)☆β在每個(gè)因子(zǐ)上(shàng)的(de)得(de)分(fēn ®)乘以該因子(zǐ)的(de)權重就(jiù)得(de)到(dào)這'♥±÷(zhè)支股票(piào)在該因子(z"'φ∞ǐ)上(shàng)的(de)得(de)¶&₹分(fēn)。将該股票(piào)在所有(yǒu)£§ n 個(gè)因子(zǐ)上(shàng)的(de↕δγ)得(de)分(fēn)相(xiàng)加就(jiù)得(de)到(Ω∑¶ dào)該股票(piào)的(de)總分(fēn)。最終,按總分(fēn)對(duì)所有(yǒu)股票(piào)&&←β排序,然後選擇排名最高(gāo)的(de)∑★α m 支股票(piào)作(zuò)為(wèi≥→)最終的(de)量化(huà)選股結果。同樣,m 的(de)确定可(kě)¥∞★✘以有(yǒu)兩種方法:
1. 設定優秀股票(piào)得(de)分(fēn)阈值,如(rú)果一(yī)個(gè)股票(pià ↕δo)的(de)總分(fēn)高(gāo)于該阈值則入≈★選,因此 m 不(bù)固定。如(rú)果阈值選取的(de)不(₽↓bù)好(hǎo),那(nà)麽可(kě)能λ≥(néng)出現(xiàn)選出來(lái)∏±σ≤的(de)股票(piào)個(gè)數(shù)過少(shǎ©πo)甚至無法選出股票(piào)的(de)情況。我們會(huì)在後面說(s→huō)明(míng),這(zhè)也(yě)不(bù)一(£π→yī)定完全是(shì)缺點。
2. 設定固定的(de)股票(piào) ≈個(gè)數(shù) m(考慮到(dào)分(fēn)散個(gè)股風(fēng)險,m 一(©®♥yī)般取 50 到(dào) 100 之間(jiān))。将所有(∑<λ'yǒu)股票(piào)按其總分(fēn)從(cóng₹✔)高(gāo)到(dào)低(dī)排序,選出前 m 個(gè)股票↔∞™(piào)。
因為(wèi)在現(xiàn)實中無法做(zuò)↑λ空(kōng)個(gè)股,因此在實際操作(zuò₹₽≈)中,投資者可(kě)以買入選股模型優選出的(de) m 支股票(pi©<>ào),并持有(yǒu)到(dào)下(xià)一(yī)次選股模型重新選擇。©®"
3 問(wèn)題和(hé)討(tǎo)←≤±論
上(shàng)述量化(huà)選股模型存在以下(xδ↓∞ià)幾個(gè)問(wèn)題:
1. 僅僅使用(yòng)了(le)有(yǒu)限個(gè)選股§≠ 因子(zǐ):無論是(shì)固定因子(zǐ)個(gè)數(shù₩≤¶≥)或者使用(yòng)因子(zǐ)選股能(néng)力阈值,最終使用(yòng♦€)的(de)都(dōu)是(shì)有(yǒu)限的(de) n 個(gè₩∞)因子(zǐ),從(cóng) n+1 之後的(de)因子→α(zǐ)就(jiù)被舍棄了(le)。因此,剩餘因子(zǐ)的(de)≥♣選股作(zuò)用(yòng)不(bù)作(zuò)考慮,造成模型設定偏誤。δ♠™
2. 假設因子(zǐ)間(jiān)的(de)作(zuò)用(yòng)是(s✘∞γ♣hì)獨立的(de):模型在選擇因子(zǐ)時(shí),逐一(yī)獨立地(≤≈'dì)考慮每個(gè)因子(zǐ),完全忽視(shì)因子(♣¥©Ωzǐ)之間(jiān)的(de)非線性關系。這(zhè™§)也(yě)是(shì)選股模型的(de)局限性之λ± 一(yī)。
3. 因子(zǐ)可(kě)能(néng)存在多(duō)重共線性(✔₩∏即獨立性的(de)假設不(bù)成立):如(rú)果兩個(gè)或多(duō)個(gè)優選出來(®λ¶lái)的(de)因子(zǐ)有(yǒu)很(hěn®Ω∑)高(gāo)的(de)線性相(xiàng) ∑關性,則它們的(de)效果相(xiàng)似。如(rú)果不(bλ₹λ&ù)作(zuò)處理(lǐ)而把它們當做(zuò)獨立的(de)因子(z£δ$ǐ),則會(huì)加強選股在這(zhè)類因子(zǐ)上(shànα§↓©g)的(de)偏重程度,造成偏差。因此必須要(yào)檢驗≠₹ 并剔除多(duō)重共線性,确保最終選出的(de)因子(zǐ)之間≥&(jiān)是(shì)相(xiàng)互獨立的(₽¶¶&de)。
4. 小(xiǎo)市(shì)值高(gāo©<πΩ) beta 股傾向:衆所周知(zhī),由于高(gāo) bet>φ↑↔a 股承擔了(le)更高(gāo)的(de)市(shì)☆<§∏場(chǎng)風(fēng)險,它們有(yǒu)著(zhe)更高(£≤gāo)的(de)收益。在量化(huà)選♦≥股模型中,股票(piào)按因子(zǐ)排名,而非按股票(piào)∏¶↕γ對(duì) beta 修正後的(de)收益率排名,然後按排名∞'↕前後 1/5 股票(piào)的(de)絕對(duì)收益率對(duì) ≠Ω因子(zǐ)效果評價。因此這(zhè)會(huì)造對←∏λ₩(duì)成市(shì)值類因子(zǐ)<δ選股能(néng)力的(de)高(gāo)估,↓∞✔®從(cóng)而選出的(de)股票(piào)大(dà)×↕♣☆多(duō)也(yě)都(dōu)是(shì)小(xiǎo)市(shì)£♠值股票(piào)。
5. 固定的(de)選股個(gè)數(shù):無論市(shì)場(chǎng)行(xíng)情如(rú)何,這(zhè)個✘ ♦(gè)選股模型通(tōng)常選擇前 50 到(dà♠♠∑o) 100 相(xiàng)對(duì)優秀的(de)股票(₽βσpiào)。但(dàn)我們知(zhī)道(dào±§♠),當市(shì)場(chǎng)很(hěn)差的(de)時(shí↕σ•±)候,即便得(de)分(fēn)最高(gāo)的(de)那(nà)些(xiē¥₽×∑)股票(piào)的(de)分(fēn)值可(kě)能(néng)也(©✔☆yě)會(huì)很(hěn)低(dī)、後市(shì)走勢也(yě)¶≠¶會(huì)随大(dà)盤一(yī)樣下(xià)跌。在這✔®(zhè)種情況下(xià),如(rú)果仍然偏執的(de)<♣選出 50 到(dào) 100 支股票(piào),效果可(kě)想而$φ•知(zhī)。
針對(duì)這(zhè)些(xiē)問(wèn"∞×)題,可(kě)以考慮以下(xià)幾方面:
1. 綜合考慮多(duō)個(gè)因子(zǐ),而非獨立篩選單®&λ一(yī)因子(zǐ),捕捉因子(zǐ)之♠£π間(jiān)的(de)相(xiàng)互作(zuò)用(yòng)。×∑₹×
2. 使用(yòng)非線性的(de)有(yǒu)監督學習(xí)算(suà✘γn)法對(duì)股票(piào)進行(xíng)分(fēn)類,捕→♠ 捉高(gāo)收益率股票(piào)的(de)特征,進而選股。
3. 用(yòng)選股模型作(zuò)為(w↓≈èi)另類擇時(shí)工(gōng)具。當某期股票(piào)的(de)打分(fēn✔∑♠™)都(dōu)很(hěn)低(dī)的(de)時(shí)候,不(bù)一≠∏(yī)定要(yào)刻意的(de)非要(&γ€yào)選出多(duō)少(shǎo)支股票(piàoαε≠)。不(bù)妨認為(wèi)這(zhè)恰恰說(shuō)明(míng)了(β✔ le)市(shì)場(chǎng)的(de)弱勢,不(bù)應持股。在這(zδφhè)種情況下(xià),選股模型便成為(wèi)了(le)一(yī)個(Ω©gè)擇時(shí)工(gōng)具。
4. 提高(gāo)選股模型的(de)使用(yòn&±$g)頻(pín)率:雖然财務因子(zǐ)在财報(bào)披露時(shí)才能(néng)更§↔λ新,但(dàn)技(jì)術(shù)類或者其他(tā)類因子☆∞(zǐ)叠代的(de)更頻(pín)繁。因此可(kě)以考慮提✘&高(gāo)選股頻(pín)率。當然,選股頻(pín)率提高(gāo♦&¥)并不(bù)意味著(zhe)我們應該提®≠←♣高(gāo)股票(piào)池內(nèi)股票(piào)的(de)輪★'>σ動頻(pín)率,仍應該保證每支選出的(de)股票(piào)被×₽持有(yǒu)一(yī)段時(shí)間(jiā∑ n),再被新的(de)股票(piào)替代。因此可(kě♣φ)以考慮滾動輪動的(de)方法,比如(rú)每一(€₽yī)個(gè)月(yuè)重新選股一(yī)次,然後每次從(cóng) ∑投資組合中替換最早進入的(de) 1/3 的(de)股票(piào¥♥),這(zhè)樣可(kě)以保證每支股票(piào)至少(shǎo)在✘>投資組合中持有(yǒu) 3 個(gè)月(yuè)。
免責聲明(míng):入市(shì)有(yǒu)風(fēng)險,投資需謹慎。在任何情況下(xi♣&±←à),本文(wén)的(de)內(nèi)容、信息及數(s±πhù)據或所表述的(de)意見(jiàn)并不(bù)構成對(duì)任何人♦ (rén)的(de)投資建議(yì)。在任何情況下(xià),本✘≤Ω文(wén)作(zuò)者及所屬機(jī)構不(bù)對(duì)任♣✘何人(rén)因使用(yòng)本文(wé♣₽₹n)的(de)任何內(nèi)容所引緻的(de)任何→φ♣損失負任何責任。除特别說(shuō)明(míng)外(wài$♥ ),文(wén)中圖表均直接或間(jiān)接來(lái)自(zì)于相(x✔εiàng)應論文(wén),僅為(wèi)介紹之用(yòng),版權£↕©歸原作(zuò)者和(hé)期刊所有(yǒu)。