Palantir:整合性企業數據分析軟體的競爭定位 (上)

Julian 是基石的實習生,目前就讀台大。過去有 Data Scientist 相關的實習經驗,因為對 SaaS 模式的新創有興趣,同時也想了解 VC 怎麼分析新創的商業潛能,所以加入基石。喜歡籃球、鋼琴還有 Steam 上的各種遊戲。


Palantir 簡介

1. 商業模式

Palantir 的獲利模式有別於一般商品銀貨兩訖的銷售,而是在提供客戶數據分析軟體服務後,依據使用的期間收費。其主要產品包含分析平台 Gotham、Foundry,以及後臺系統 Apollo。Gotham 以美國政府及其友邦為主要客戶,主要應用於軍事與反恐領域,協助軍事單位偵測及預測敵對陣營行動,並提供可行的解決方案。Foundry 則主打商業市場,協助企業整合與分析分散在營運流程當中的資料,並做出商業決策,常見的應用情境如供應鏈管理以及藥物研發。相較之下,Apollo 則為 Palantir 管理及部屬 Gotham 與 Foundry 的系統。

Palantir 的營收源自客戶支付的軟體使用費,通常透過簽署長年期的合約協助客戶部署軟體,並將其與營運流程整合。不過由於 Palantir 極為強調機密性,與大部分客戶簽有保密條款,使得外部難以詳細的了解其與客戶的合作模式。不過從 2021 年 Q1 公布的資訊可以發現,Palantir 目前執行中的合約平均時間長度為 3.7 年,商業客戶則為 4.6 年。合約期間若客戶分析的需求上升,合約長度、服務內容也會有所調整,該客戶平均每年對 Palantir 的營收貢獻額也會隨之變動。

Palantir 2020 至 2021 各客戶開發階段獲利情況

客戶經營 Palantir 則區分為三個階段,Acquire、Expand 與 Scale。Acquire 階段,Palantir 會以極低的價格或甚至免費替客戶部屬軟體,透過實驗性專案 (Pilot Program) 協助企業將分析結果應用於營運,此階段之客戶年營收貢獻額低於 USD 100,000。實驗性專案結束後若客戶願意實際訂閱軟體,客戶經營便會進入 Expand 階段,年營收貢獻額超過 USD 100,000,Palantir 亦會於此階段嘗試向客戶追加銷售其他產品功能。Scale 階段則代表客戶除了既有的模組之外,需要更為客製化的分析功能,Palantir 此時會協助客戶開發新的客製化軟體與演算法,或是依據客戶的要求於 Gotham 及 Foundry 的架構上開發新功能。


2. 管理團隊

創辦人

Palantir 極為強調創辦人對於企業的掌控。依據其 S-1,創辦人 Alexander Karp、Peter Thiel 與 Stephen Cohen 持有之 Class-F 股票會使三人永久的握有 Palantir 49.99%的股權。若創辦人進一步買入其他股票,使三人股權占比大於 50%,Palantir 便會成為 NYSE 所定義之「Controlled Company」,公司治理規範與其他一般上市公司存在差異。譬如董事會可選擇不設置獨立董事席位,薪酬委員會、提名與公司治理委員會也不可選擇不由獨立董事組成。不過由於上市過程中受到市場及 SEC 的雙重壓力,Palantir 於 2020 年起聘僱了 4 名獨立董事,以加強公司對於股東權益的重視,提高股票對投資人的吸引力。

Palantir 獨立董事

4 名獨立董事包含 Zillow Group 創辦人 Spencer Rascoff,Palantir 前營運總監與目前 8VC 合夥人Alexander Moore,華爾街日報記者 Alexandra Schiff,以及前 Accenture 顧問 Lauren Friedman Stat。值得注意的是 Alexander Moore 為 Palantir 創始成員,8VC 亦為 Palantir 早期 VC 投資人之一。Palantir 雖然聲稱董事會由獨立董事占多數,但實際影響力為何則有待商榷


3. 業務開發

協助美國政府對抗恐怖主義為 Palantir 的創立目標,但當時矽谷的 VC 並不看好其商業模式。Palantir 因而僅獲得 Founders Fund 以及 In-Q-Tel 的資金挹注。前者為創辦人 Peter Thiel 創立及自行管理之 VC,後者則為 CIA 管理之基金。

獲得 In-Q-Tel 的策略性投資對於 Palantir 早期的發展相當重要。原因在於In-Q-Tel 的投資皆以能協助 CIA 增強間諜活動能力、情蒐能力及權力為主要目標,而 Palantir 的創立時間及創立目標恰巧與當時 CIA 在 911 恐怖攻擊事件後的業務重點有相當大的關聯性。此外,透過 CIA 資助之實驗性專案,Palantir 也逐步建立起產品架構,並利用 CIA 的內部資料訓練模型,例如 Palantir 研發之犯罪預測系統 (Pre-crime Technology) 可協助情報單位在行為人犯罪之前預知其犯罪的可能性。

除了商業模式的性質之外,Peter Thiel 與政界的關係應也對於 Palantir 的發展有深入的影響。Peter Thiel 長期贊助自身支持之政治人物,著名之案例包含前總統 Donald Trump。2016 年 Peter Thiel 也曾於共和黨的全國大表大會上公開發言。2022 年起 Peter Thiel 影響政界的措舉更為明顯,總共贊助 16 名參議院、眾議院候選人,更宣布自己將更投入在 Donald Trump 往後的選舉活動。

美國政府單位 IT 支出

受惠於 CIA 的支持以及 Peter Thiel 與政府的關係,Palantir 於政府市場的業務成長快速,2021 年營收為 USD 899M,約占 DoD IT 支出 2.3%。然而從長期目標市場的成長來看,政府市場 (Government Market) 的成長有限,每年約以 5% 的速度在成長。Palantir 目前約 10% 的政府市場營收成長率在未來可能趨緩。如何加速開發商業市場 (Commercial Market),以找到下一個強力的成長動能,因而成為 Palantir 的重要課題。


企業數據分析 (Data & Analytics) 市場概況

1. 定義與市場規模

數據分析產業存在的目的在於協助企業分析大量數據以進行決策,範圍涵蓋策略規劃、預算制定、銷量預測等,為 SaaS 產業的分支。近年受惠於軟硬體技術進步及雲端運算的發展,市場規模成長快速,預計將於西元 2030 年達到 684 億美元,10 年 CAGR 約 13.5%。

2. 產業價值鏈

若依據數據分析的流程將產業價值鏈加以拆分,可以依序分為資料獲取 (Data Acquisition)、資料倉儲 (Data Storage)、資料分析 (Data Analysis)及資料終端應用 (Data Usage)。不過由於企業可不斷利用新技術豐富 (Enrich) 現有資料、探索新應用方式,使得企業內部的數據分析流程具有循環 (Recursive) 的特性,而非單向的、線性的作業流程。

以零售業的發票紀錄為例,資料集通常包含銷售時間、品項名稱及價格,為了豐富 (Enrich) 現有資料,企業可以利用品項被同時購買的頻率,將品項貼上不同的類別標籤。由於消費者的購買偏好會隨時間改變,企業便需要定期為各品項重新貼標。由於分析的流程相同,企業內部的數據分析業務因而具有循環 (Recursive) 的特性。鑒於這樣的特性,大型的數據分析軟體通常涵蓋數據分析的各項功能,以優化使用者的工作效率,例如 SAP 的財務系統除了協助客戶儲存財務資料,亦可助其進行財務分析,協助企業進行決策。

以下詳細介紹數據分析各環節所代表之意涵。

資料獲取流程,可簡單分為 ETL 三個階段

「資料獲取」即為 ETL (Extract Transform Load),泛指原始資料 (Raw Data) 的蒐集與清洗等前處理流程。程序大概如下,首先自各式資料來源抽取結構性資料 (Structured Data) 及非結構性資料 (Unstructured Data),並透過編號、整併等方式將資料轉換為資料庫可以儲存的格式,最後再將資料載入資料庫當中。結構性資料通常為已存在但散佈於各終端處理器之資料表,非結構性資料則泛指聲音、影像及字串等。若依據資料內容區分,則可分為財務、行銷、供應鏈等領域,其資料來源有所差異。

On-premise 與 Cloud 之資料倉儲架構

「資料倉儲」泛指協助企業儲存營運、行銷、製造等過程中所產生的資料,為價值鏈中硬體投資成本最高的區塊。依照不同的資料倉儲架構,如  SQL、NoSQL 等,使用者呼叫資料的效率及儲存成本也所不同。依硬體的所有權及連結方式區分,也可將資料倉儲方式分為 On-premise 與 Cloud。一般而言 On-premise 架構為使用者利用內網連接企業自有之伺服器與資料庫,通常由內部 IT 團隊管理,Cloud 架構下使用者則需透過網際網路連結外部伺服器及資料庫,Google 與 Snowflake 皆為著名的資料倉儲服務提供者。從資料使用企業的角度出發,On-premise 可擁有較高的資料安全性,常見的應用場景如藥物研發、軍事科技、金融業等,但 Cloud 架構的成本較低,零售業、餐飲業因而大多採用 Cloud 的架構。

以目的區分之資料分析類型

「資料分析」泛指將資料 (Data) 轉換為訊息 (Information) 的過程,以協助企業進行決策。資料與訊息的差異在於,分析前的資料通常無特別意義,具有多樣的解讀方式,例如商品 A 的價格為 USD 100 元。資料分析後產生的訊息則對企業決策有所幫助,例如商品 A 價格 USD 100 元,高於平均市價 10%。 10% 這個訊息即可讓企業了解商品的價格定位,進而決定後續的行銷策略。

依據分析的目的區分,可以將資料分析大致為敘述性分析 (Descriptive Analysis)、診斷性分析 (Diagnostic Analysis)、預測性分析 (Predictive Analysis) 及規範性分析 (Prescriptive Analysis)。敘述性分析通常為頻率、樞紐分析等敘述性統計。診斷性分析目的在於發掘問題的因素,常見的演算法如 Root Cause Analysis。預測性分析旨在預測關鍵指標的未來走勢,Time Series Analysis、Machine Learning 等皆為常見的分析預測方式。規範性分析則希望能進一步推測不同決策所產生的結果,並計算不同決策下各情境的發生機率,Markov Decision Process、Stochastic Optimization 等為常見的模型。

「資料終端應用」以企業決策為中心,泛指數據導向 (Data Driven) 的商業活動,為數據分析產業創造價值的核心。依據企業內部的組織功能,可以將其區分為營運、財務、研發、行銷等區塊,不同的組織功能依據其決策性質的差異,對於上游資料獲取、資料分析等的需求也有所不同,為數據分析產品差異化的主要來源。以行銷數據分析的應用為例,為了向客戶投遞數位廣告,企業便需要藉由 cookie 了解使用者於網頁的瀏覽主題、頻率等,據此將客戶區分為不同的客群之後,再依據他們的偏好推送適合的廣告。以製造業的應用為例,工廠則需要透過感測器 (Sensors) 蒐集機器的運作狀況如溫度、壓力等資訊,再結合產出良率,據此調整機器的操作方式以提高工廠的產出。兩者所需要的資料不同,獲取方式有所差異,最終的分析方法也不同,因而有各自專精的數據分析服務提供者。


Palantir 競爭分析

Palantir 產業價值鏈定位

1. 產品發展策略

由於資料分析流程具有循環的特性,大型數據分析軟體供應商在規模化後常進行垂直整合,以提高客戶黏著度。目前主要的數據分析軟體,依據產品發展策略可將其大致分為兩類:

第一類為 SAP 與 ORACLE 等 ERP 軟體商。由資料倉儲開始發展,原先以協助客戶建立營運、財務資料庫為主要業務,近年逐步拓展至資料分析的領域,旨在幫助客戶應用大量的營運與財務數據,以優化企業決策。

第二類為 Salesforce 等 CRM 軟體商。以資料獲取與資料分析為主要服務內容,旨在協助客戶管理分散於各管道、各資料庫的客戶資訊,近年亦開始提供 AI、資料視覺化等進階的分析服務。

Palantir 的產品發展策略較傾向於後者,但相較 Salesforce 等 CRM 軟體商更強調資料分析的發展,在公司創立初期便集中資源朝向 AI 的架構發展。在資料獲取以及管理上,Palantir 也更為強調非結構性資料的處理,相對之下一般的 CRM 軟體商常是整合多個資料庫並以處理結構性資料為核心。這樣的產品發展策略原因在於,為了開發 IT 系統與資料倉儲系統較為落後的政府客戶,且反恐行動所需要的資訊常散布在各式的文件當中,使得 Palantir 需要有強大的非結構性資料整合 (Data Integration) 能力,包含電子郵件、PDF 等文件。

在軟體的使用體驗上,Palantir 主要透過 Graph、Map、Objective Explorer 與 Browser 等四個介面協助使用者進行分析。實際的資料處理功能涵蓋極廣,例如 Gotham Video 與 Foundry Monocle 等。

Graph,將事件資料轉換為節點 (nodes) 與邊 (edges) 以分析關聯性
Map,透過地理區位的熱圖追蹤事件與物件
Object Explorer,藉由互動性的方式讓使用者進行更深入的資料探索
Browser,檢索及搜尋資料,並呈現分析結果
Gotham Video,偵測衛星影像中的重要軍事單位位置,並預測可能的移動方向
Foundry Monocle,使用者可以追蹤資料整合的流程,並即時調整與維護

2. 彈性架構及佈署時間成本

SAP、Salesforce 與 Palantir 大致系統部屬時間成本

依據資料的數量、複雜度以及企業組織規模,數據分析系統的部屬時間差異極大。不過大致而言,SAP 需要部屬半年至一年,Salesforce 約一個月,Palantir 則聲稱 Gotham 與 Foundry只需花費數小時。雖然詳細的情況有待商榷,但背後原因可能在於系統資料架構以及佈署環境的差異。

一般營運所用之資料集多經過多重的處理與整併

系統資料架構上,SAP 需要透過顧問協助客戶建立資料庫,將形式各異的營運、財務數據彙整為資料庫內的結構性資料,而 Salesforce 與 Palantir 則以整併企業內部各資料庫為主。在彙整 (Integrate) 資料的策略上,Palantir 的 Data Pipeline 採用自動化、彈性化的基礎架構,以彙整最原始的數據 (the Most Granular Sources) 為主,避開已經過整併、前處理的資料,因而免去人工系統對接以及大量資料比對與除錯所需要的時間。為了回答客戶彙整資料所希望解決的商業問題,Palantir 也會利用演算法預先將資料集分組,協助使用者關注與該商業問題相關的資料庫。

佈署環境上,Palantir 可以在多樣化的託管環境 (Hosting Environment) 下運作,包含公有雲 (Public Cloud)、私有雲 (Private Cloud)、本地數據中心 (On-premises Data Center)、分類環境中的氣隙網路 (Air-gapped Networks in Classified Environments)、邊緣計算環境 (Edge Computing Environment)、筆電 (Laptop) 以及專用硬碟 (Specialized Hardware)。多樣化的佈署環境使得 Palantir 可以更快速的協助客戶佈署軟體,縮短調整軟體架構、系統對接等的佈署時間。


3. 數據孤島整合能力

數據孤島 (Data Silos) ,企業內部相互獨立的資料系統及延伸出的商業決策

目前許多大型企業並非欠缺數據、缺乏資料庫,而是組織沒有整體的資料管理策略,使得資料庫的架構複雜、互不相容。背後的原因可能為成本考量因素,各部門以自身開發目的及時程為優先,或是組織政治問題導致資料無法串連。

有兩種常見的策略可以解決數據孤島的問題,資料庫系統重整及資料獲取方式優化。資料庫系統重整旨在改動整體系統架構,雖會大幅優化系統營運,但耗時且成本高昂,對於大型企業的營運也存在相當程度的風險。南山人壽的境界計畫即為著名的失敗案例,南山斥資 NTD 10.1B 與 SAP 合作整頓 ERP 與 CRM 等系統,但 2019 年系統上線後卻造成 15.2 萬件保單失效或停效的問題。資料獲取方式優化則以彙整現有資料庫中的結構性資料,以及電子郵件、文件與圖像等非結構性資料為主,目的是在目前的資料庫架構上建構另一個整合性的資料獲取平台,以協助企業提升數據分析的價值和速度,但是平台的資料串接品質及運行效能可能較前者低。簡而言之,為了打破數據孤島,企業需要在財務成本、時間成本及組織政治問題之間做取捨。

Palantir 以資料獲取方式優化為主要策略,透過多樣化的數據連接器 (Data Connector),例如第三方 SaaS 、客戶及 Palantir 維護的插件,Palantir 可以快速的整合客戶擁有的各個資料庫。快速的佈署、較低的資料庫彙整時間,以及相對較低的財務成本,使得企業較容易推動組織內部的轉型或是跨部門的協作。


4. 資訊安全

全球惡意軟體數量 (百萬)
US Department of Defense IL

近年被偵測或回報的惡意軟體數量約以 27% 的 CAGR 成長,企業對於網路、雲端服務的仰賴度不斷上升後,對資訊安全的要求也逐漸提高。由於 Palantir 以提供美國國防部數據分析服務切入市場,接著才以私人企業為客戶,使其相較於其他企業級的數據分析軟體,具有安全性上的優勢。以美國國防部 (DoD) 的雲端運算安全要求指南 (CC SRG) 為標準,Palantir 的表現優於 SAP、ORACLE 及 Salesforce。

Palantir 資訊安全的優勢與其創立背景有深厚的關係。CIA 持有的 In-Q-Tel 為 Palantir 早期投資人,且 Palantir 的產品原型也是使用 CIA 內部數據訓練而成,其產品架構的開發方向即是美國政府對於雲端系統的規範。此外,創辦人 Peter Thiel 對於政界也存在影響力,除了長期贊助各州參議院、眾議院候選人競選資金之外,從 2016 年於共和黨代表大會的演講就可窺見他與共和黨深厚的關係。從全球政治的觀點出發,Palantir 於 S-1 當中也明確表述自身的政治立場,其目標客戶為美國政府及其友邦,也僅限於此。相較之下,SAP 與 ORACLE 有相當多的中國客戶,因而無法進行這樣的立場表述。

雖然商業市場與政府市場有所差異,但透過大量的美國政府合約,Palantir 也證明自身有極高的資訊安全技術,政治立場的策略定位也使其在敏感資訊的處理上相對於 SAP 與 ORACLE 更能取得客戶信任。


5. Buy or Build

為大型企業提供分析軟體服務的 Palantir 除了面臨同業的競爭,也面臨客戶內部 IT 團隊的競爭。大型企業在導入數位化分析工具時,常面臨自行開發 (Build) 以及向外部 SaaS 廠商採購或訂閱 (Buy) 的抉擇。向外部供應商採購數據分析軟體所費不貲,隨著購買的模組數量上升,軟體的訂閱費用也會急速的上升。若企業內部能招募配置完整的資料分析團隊,企業便能自行利用自有的數據,產生分析結果。

不過 SaaS 廠商存在的效益在於,相較於單一企業所能負擔的 IT 成本,SaaS 廠商可以投資更多的 R&D 資源於軟體開發,使其軟體效能顯著的高過企業內部自行研發的軟體,並銷售給大量的客戶解決他們相似的問題。當 SaaS 軟體與企業的組織運作流程契合度愈高,組織便會形成一股愈強的慣性,因而使企業不容易中途轉換軟體,或是自行研發新的數據分析軟體。

Palantir 在這樣的商業模式上又做了些微的調整,除了軟體產品,Palantir 也提供 IT 諮詢服務。利用 Gotham 及 Foundry 彈性的系統架構,Palantir 可讓客戶在平台的架構上自行研發新的功能,或是做為外部的 IT 團隊協助客戶開發新功能。從資料獲取到資料終端應用這樣 end-to-end 的解決方案,再加上開發者平台 (Develop Platform) 的特性,使得客戶在採用 Palantir 的產品後願意額外採購新功能,提高訂閱費用。這樣的特性也體現在 Palantir 的客戶經營流程中, Scale 階段高額的客戶平均營收貢獻額。


結論 (上)

隨著企業數據分析需求的上升,原先以資料倉儲、資料管理為主要業務的 ERP 與 CRM 供應商開始向既有客戶追加銷售相關的數據分析模組,包含 AI、機器學習、資料視覺化等模型。當 Palantir 從政府市場轉向商業市場發展,勢必會加遽與 SAP、ORACLE 與 Salesforce 等產業領導者的競爭。

與傳統的 ERP 系統商 SAP 與 ORACLE 相較,Palantir 的產品發展策略與 Salesforce 較為相近,以資料獲取與資料分析為核心。不過在競爭定位上,Palantir 有幾項獨特之處。第一為彈性的佈署架構,Gotham 與 Foundry 可以於公有雲、私有雲或是本地數據中心佈署及運作,使得 Palantir 的產品能應用於多樣化的需求情境,佈署時間成本也較競爭者低上許多。第二為彈性的資料獲取架構,Palantir 藉由大量的數據連接器獲取原始資料,除了一般雲端資料庫如 AWS S3、SAP 與 Azure Data Lake,還包含客戶的小型資料庫,或是電子郵件、文檔等非結構性資料。自動化的 Data Pipeline 及演算法的資料管理,讓客戶更容易打破內部的數據孤島。第三為敏感數據處理能力,政治上 Palantir 明確表述自身對於美國政府及其友邦的支持,技術上 Palantir 也使其產品可以於 On-premises 或是 Air-gapped Network 等無法連接網路的系統當中擁有相同的資料處理與運算能力,明確的定位使 Palantir 更容易與客戶建立信任感。

前半部分主要著重在企業數據分析軟體產業的產業結構,以及 Palantir 的產品策略。下半部分將會著重在財務數據的分析,了解 Palantir 的獲利情況以及成長動能。

發表留言