2017年6月30日 星期五

集成模型(預測分析時代)

從現在起,勝負的關鍵就在於預測分析的能力。預測分析就是商業智慧發展的方向。遊戲規則早已改變,而你身在其中。閱讀本書,可以讓我們了解世界進步到哪,還會往哪個方向邁進。本篇只介紹「集成模型」。

Netflix 線上租片業者在2008年推出一項預測分析競賽(影片推薦),目的要改善本身提供顧客的影片推薦功能。Netflix 公司向全球專家們招手,誰能協助Netflix 公司將自家影片推薦功能的績效提升10%,就能贏得百萬美元獎金。

集成模型
雖然誰也不知道提高10%績效這項目標是否可能達成,但是大家總認為隨時可能有團隊發現一項突破而一舉奪冠。果然,2008年9月這項突破出現了,暫時讓其它領先的參賽者位居落後。來自AT&T研究部門的BellKor跟奧地利新創事業的年輕團隊BigChaos聯手出擊,把兩個團隊的預測模型加以混合,組成一支超級團隊。

這個做法果然奏效,預測分析的進步能量由此展開,將兩個複雜的預測模型加以組合,其實很簡單:只需要預測建模應用於學習如何把兩個模型結合。由於每個模型都是從機器學習產生,這種行為就是「建構於學習上的學習」,也就是所謂的「後設學習」。

因此,競爭對手變成合作隊象,與其辛苦鑽研、絞盡腦汁比較和對照各自的理論與方法,BigChaos團隊成員托切爾告訴我,他們把組合的工作交給預測建模處理,他們訓練一個建構在兩個既有模型之上的新模型,新模型就像一位主管。

接著,這個新的「集成模型」依據各別個案,考量兩個既有模型的預測。這樣一來,就訓練集成模型預測出各別模型比較不適合預測哪些個案。或許兩個模型對許多個案的預測結果是一致的,但在結果出現差異時,就能結合模型提供機會來改善績效。

以Netflix大獎來說,現在比賽規則已經改變,引起一波團隊合併、將模型整合的風潮,小團隊各自結盟變成實力更強大的大團隊。這情景就像迅速發展產業中,企業併購的情形那樣。

而那個超級團隊再度又併了之前一直名列前茅的Pragmatic Theory(實用論)隊,且更名為BellKor's Pragmatic Chaos。

團結力量大——精彩大結局
不過,比賽還沒結束。後來,旗鼓相當的對手出現了,這個對手以The Ensemble(集成團隊)為名。這個對手積極合併其他團隊,形成一個超級大團隊,要跟BellKor's Pragmatic Chaos力拼爭奪獎金。最後,The Ensemble總共合併了二十多個團隊,簡直是把所有想參賽的團隊都納入其中。

這種情況跟《星際爭霸戰》中,令人討厭、像蜂群般的博格人(the Borg)一樣,博格人發出這樣的威脅聲明後就把智慧生物消減掉:「你們會被同化!」於是,The Ensemble就以這種大魚吃小魚的做法壯大自己。畢境,俗話說的好:打不贏,就入夥。

最後成績BellKor's Pragmatic Chaos和The Ensemble不相上下,依照比賽規則等於同分。但BellKor's Pragmatic Chaos以些微之差勝出,贏在它早了二十分鐘上傳交件。

模型……群體智慧
預測模型的集成同樣可以從「集體智慧」效應受惠。跟個人所做的推測一樣,每個模型有自己的優點,模型產出的預測分數並不完美,有些可能高估、有些有能低估。把模型組合後得到的平均分數,就能把大部分缺失去除掉。

集成建模已經襲捲預測分析界。這項做法被認為是二十一世紀頭十年中,在預測建模方面的最重要進展。這種做法在群眾外包競賽中獲得勝利,讓本身的可信度大增,也說服大家認同這種做法可以擴及到商業應用並推升研究發展。

集成模型的商業應用日漸擴大,本書附錄總表列出的預測分析實例中,至少有八個集成模型,包括:IBM(超級電腦華生參加《危險邊緣》益智節目比賽)、美國國稅局(逃漏稅)、大自然保護協會(預測捐款)、Netflix公司(影片推薦)、諾基亞西門子(預測通話斷訊)、美國國防部(報假帳)、以及美國陸軍特種部隊(預測工作績效)。

結語
由於股票投資也是跟預測分析有關的金融行為,所以接著我想要問讀者一個有關機率的問題:

假設基本分析有50%的機率獲利,而技術分析同樣也有50%的機率獲利。若有一支股票同時被基本分析和技術分析,預測它將來股價會上漲,那這支股票的獲利機率會是多少?

這題問題若你問我正確的機率是多少?我也回答不出來。但肯定的是,我會回答:「投資這支股票的獲利機率應該高過50%。」我會提出這題的原因是跟本篇主題「集成模型」有關。若基本分析是A模型,技術分析是B模型,而結合兩者的AB「集成模型」的投資績效應該會勝過單獨只使用A模型或B模型。

但在台灣的投資人往往喜歡分門別類,學習基本分析的人往往都是認為技術分析並不可靠;而學技術分析的人往往認為財報也可作假,只有股價才是反應其真實的一面。雙方往往都是壁壘分明。

由於我的資料包含了三個分析模型,分別是:「價值分析模型」、「成長分析模型」和「關鍵點分析模型」,以致「財訊雙週刊」的人也搞不清楚,曾寫信問我到底是哪一類型的投資人。

其實我近年已經越來越模糊,我採用的即是類似「集成模型」的做法,而我的投資績效也確實大大的提升。例如我今年買進的至上(8112)混合了「價值分析」和「關鍵點分析」【請參考:預測分析(預測分析時代)】;買進的江興鍛(4528)混合了「成長分析」和「關鍵點分析」【請參考:關鍵點分析—江興鍛(4528) 106年 5月】。

若你發現你的投資績效已經很多年都無法再提升,可能是你只採取的單一模型有關,就像我早年發現的問題一樣(我早年是基本分析派,不相信任何的技術分析)。

有趣的是,以前讀者訂閱「成長力資料」和「關鍵點記錄」是五五波,就像「基本分析」和「技術分析」一樣壁壘分明。但現在訂閱「關鍵點記錄」已一面倒,並不是因為「關鍵點記錄」免費贈送「成長力資料」和「價值線資料」的關係,而是他們也被我這種另類「集成模型」的做法所影響。

有關書籍的介紹,請參考:作者、出版社、內容簡介
更多的理財書目,請參考:汪汪書架的書–理財書籍