金融, 通俗地講, 就是為有錢人理財(cái), 為缺錢人融資, 也就是投資和融資. 在第四次工業(yè)革命的背景下, 智能投顧和大數(shù)據(jù)信用評(píng)價(jià)分別是金融科技對(duì)投資和融資的賦能, 通過(guò)技術(shù)、數(shù)據(jù)和場(chǎng)景實(shí)現(xiàn)投融資能力的提升和效率的提升.
與智能投顧相比, 傳統(tǒng)的投資顧問(wèn) (investment advisor) 是介于普通投資者與專業(yè)投資者之間的角色, 負(fù)責(zé)為缺乏專業(yè)投資能力的普通投資者提供投資建議. 隨著財(cái)富的不斷增長(zhǎng), 大眾對(duì)投資顧問(wèn)的需求越來(lái)越迫切, 然而個(gè)人的精力是有限的, 一位投資顧問(wèn)僅能為有限的少數(shù)投資者提供咨詢服務(wù). 不同投資顧問(wèn)水平也存在較大的差異. 另外, 由于利益的驅(qū)動(dòng), 即使有從業(yè)道德與法規(guī)約束, 也難以保證投資顧問(wèn)的個(gè)人利益與其客戶的利益不發(fā)生沖突.
智能投顧 (robo advisor) 的出現(xiàn)就比較好地解決了上述問(wèn)題. 一方面, 通過(guò)計(jì)算機(jī)模型構(gòu)建的虛擬投資顧問(wèn), 能夠以較低的成本為大眾提供服務(wù), 而且還可以根據(jù)每位投資者自身的特點(diǎn)為其提供個(gè)性化的投資建議; 另一方面, 計(jì)算機(jī)模型能夠不帶感情地為所有人工作, 避免了投資顧問(wèn)與客戶之間的利益沖突. 智能投顧率先在美國(guó)興起, 近年來(lái)出現(xiàn)的領(lǐng)先平臺(tái)包括 Wealthfront、Betterment、FutureAdvisor 等. 隨著互聯(lián)網(wǎng)金融在中國(guó)的迅猛發(fā)展, 國(guó)內(nèi)的智能投顧也如雨后春筍般崛起, 典型的有嘉實(shí)基金的嘉貝智投、招商銀行的摩羯智投、京東金融的京東智 投等.
(資料圖片)
金融的根本是信用, 信用 (風(fēng)險(xiǎn)) 建設(shè)是一切金融產(chǎn)品定價(jià)、風(fēng)險(xiǎn)管理和投資管理的基礎(chǔ). 傳統(tǒng)的金融征信在輔助金融授信決策、防范信用風(fēng)險(xiǎn)和提升金融獲得性等方面發(fā)揮著關(guān)鍵作用, 但是傳統(tǒng)信用評(píng)價(jià)方式基于大量結(jié)構(gòu)化的信貸歷史數(shù)據(jù), 對(duì)于大部分小微企業(yè)、個(gè)人消費(fèi)以及農(nóng)村金融等國(guó)民經(jīng)濟(jì)主戰(zhàn)場(chǎng)相關(guān)的征信主體, 由于缺乏供信用評(píng)價(jià)的歷史數(shù)據(jù), 無(wú)法覆蓋, 因此無(wú)法對(duì)其提供相應(yīng)的金融服務(wù).
數(shù)字技術(shù)的發(fā)展為解決這一難題提供了方案, 大數(shù)據(jù)信用評(píng)價(jià)是指通過(guò)對(duì)海量的、多樣化的、實(shí)時(shí)的數(shù)據(jù)進(jìn)行分析和挖掘, 并運(yùn)用機(jī)器學(xué)習(xí)算法重新設(shè)計(jì)征信 評(píng)價(jià)模型, 多維度對(duì)信用主體的 (全部信息) “畫像” (簡(jiǎn)記為 “Hologram”), 呈現(xiàn)信用主體的違約率和信用狀況的征信方式. 大數(shù)據(jù)征信具備覆蓋人群廣泛、信息維度多元、應(yīng)用場(chǎng)景豐富和信用評(píng)估全面四個(gè)創(chuàng)新特點(diǎn). 金融機(jī)構(gòu)可以利用機(jī)器學(xué)習(xí)的方法, 以行為大數(shù)據(jù)替代抵押資產(chǎn), 進(jìn)行信用風(fēng)險(xiǎn)評(píng)估和防控. 大數(shù)據(jù)風(fēng)控已在全球范圍內(nèi)被金融機(jī)構(gòu)廣泛關(guān)注, 正在引發(fā)金融領(lǐng)域的一場(chǎng)革命 (參見姚前等, 2020; Yuan et al., 2019; 袁先智, 2022 等文獻(xiàn)).
隨著大數(shù)據(jù)和人工智能的發(fā)展, 金融風(fēng)險(xiǎn)建模方法, 正在從傳統(tǒng)的統(tǒng)計(jì)方法到被數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法代替. 與統(tǒng)計(jì)模型相比, 機(jī)器學(xué)習(xí)模型不過(guò)于關(guān)注模型的結(jié)構(gòu), 而更多地聚焦于如何通過(guò)多維度數(shù)據(jù)提高預(yù)測(cè)精度.
雖然機(jī)器學(xué)習(xí)算法如支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等在金融風(fēng)險(xiǎn)建模中已有不少研究, 但這些算法都屬于弱學(xué)習(xí)算法. Kearns 和 Valian (1989) 提出了將多個(gè)簡(jiǎn)單的弱學(xué)習(xí)算法 “提升” 為 強(qiáng)學(xué)習(xí)算法的集成學(xué)習(xí)方法. 同時(shí), 集成梯度提升樹 (gradient boosting decision tree, GBDT) 算法的原始想法由 Friedman (2001) 提出, 是一種基于梯度提升的集成決策樹算法, 因其泛化能力和在特征選擇方面的優(yōu)勢(shì)得到廣泛應(yīng)用. Chen 和 Guestrin (2016) 對(duì) GBDT 進(jìn)行了進(jìn)一步提升和優(yōu)化, 提出了基于極度梯度提升的集成學(xué)習(xí)算法 (XGBoost). 目前, XGBoost 算法因其更高效的學(xué)習(xí)能力一出現(xiàn)就備受業(yè)界青睞, 成為機(jī)器學(xué)習(xí)研究的熱點(diǎn). 與深度學(xué)習(xí)相比, XGBoost 算法對(duì)樣本量和特征數(shù)據(jù)類型要求沒(méi)那么苛刻, 尤其適用于金融風(fēng)險(xiǎn)建模.
然而復(fù)雜機(jī)器學(xué)習(xí)模型帶來(lái)了較高的預(yù)測(cè)精度, 但是越復(fù)雜的模型, 可解釋性就越差, 這讓模型的實(shí)際應(yīng)用價(jià)值大打折扣. 為了解釋復(fù)雜的機(jī)器學(xué)習(xí)模型, ?trumbelj 和 Kononenko(2014) 運(yùn)用靈敏度分析方法解釋模型中各變量之間的交互和冗余. Datta 等 (2016) 采用定量輸入影響測(cè)量方法分析輸入的各個(gè)變量對(duì)輸出結(jié)果的影響程度. Ribeiro 等 (2016) 提出了一種在局部學(xué)習(xí)可解釋模型的技術(shù) LIME, 該技術(shù)可用于解釋任何分類器的預(yù)測(cè)結(jié)果. Lundberg 和 Lee (2017) 闡述 了 SHAP 框架的解釋性原理, 證明了 SHAP 評(píng)估框架具有穩(wěn)定性、一致性和合理 性的優(yōu)點(diǎn); 同時(shí)他們進(jìn)一步對(duì)比了深度學(xué)習(xí)場(chǎng)景中其他的諸如 DeepLIFT、LIME、 Layer-Wise Relevance Propagation 等算法和 SHAP 值的效果, 發(fā)現(xiàn) SHAP 值更符合人們的理解和判斷.
《金融科技大數(shù)據(jù)風(fēng)控方法介紹——解釋性、隱私保護(hù)與數(shù)據(jù)安全》聚焦于邏輯回歸模型這個(gè)金融行業(yè)的風(fēng)險(xiǎn)建模標(biāo)準(zhǔn)方法和作為機(jī)器學(xué)習(xí) 在金融行業(yè)前沿應(yīng)用的集成學(xué)習(xí)模型, 通過(guò)對(duì)比和討論建立智能投顧和大數(shù)據(jù)信用評(píng)價(jià)的機(jī)器學(xué)習(xí)方法與金融科技學(xué)科相關(guān)的部分核心內(nèi)容.
對(duì)智能投顧和大數(shù)據(jù)信用評(píng)價(jià)的機(jī)器學(xué)習(xí)方法感興趣的讀者,具體情況可以參見李華、袁先智、趙建彬編寫的《金融科技大數(shù)據(jù)風(fēng)控方法介紹——解釋性、隱私保護(hù)與數(shù)據(jù)安全》一書.
本文選自《金融科技大數(shù)據(jù)風(fēng)控方法介紹——解釋性、隱私保護(hù)與數(shù)據(jù)安全》(科學(xué)出版社,2023.6)緒論.
好書
內(nèi)容簡(jiǎn)介
本書是在大數(shù)據(jù)框架下, 全面介紹金融科技在處理真實(shí)場(chǎng)景金融問(wèn)題時(shí) 需要掌握的最重要的幾類機(jī)器學(xué)習(xí)方法, 并將重點(diǎn)放在實(shí)施過(guò)程中需要用到的特征提取、可解釋性、隱私保護(hù)與數(shù)據(jù)安全共享等相關(guān)內(nèi)容的討論上.
本書內(nèi)容分三部分: 第一部分由 1~ 6 章組成, 主要講常規(guī)情況下, 機(jī)器學(xué)習(xí)在金融場(chǎng)景特別是大數(shù)據(jù)風(fēng)控中的建模應(yīng)用; 第二部分由第 7 章和第 8 章組成, 主要講在數(shù)據(jù)隱私保護(hù)和安全要求下, 機(jī)器學(xué)習(xí)如何進(jìn)行大數(shù)據(jù)風(fēng)控建模; 第三部分由 9~16 章組成, 主要講如何基于吉布斯抽樣算法建立特征提取的理論 和標(biāo)準(zhǔn)框架及其在包含投資和融資等 7 個(gè)不同金融場(chǎng)景中的應(yīng)用.
本書具有五個(gè)特點(diǎn):一是面向應(yīng)用需求, 介紹機(jī)器學(xué)習(xí)在金融場(chǎng)景特別是大數(shù)據(jù)風(fēng)控中的建模應(yīng)用; 二是緊扣應(yīng)用, 聚焦智能投顧和大數(shù)據(jù)信用評(píng)價(jià)兩大領(lǐng)域; 三是針對(duì)算法, 重點(diǎn)講邏輯回歸和集成學(xué)習(xí)建模; 四是針對(duì)數(shù)據(jù)安全和隱私保護(hù)問(wèn)題, 建立密文機(jī)器學(xué)習(xí)模型, 實(shí)現(xiàn)數(shù)據(jù)共享; 五是針對(duì)特征工程, 基于吉布斯抽樣算法, 建立支持非線性特征提取的理論和標(biāo)準(zhǔn)框架.
讀者對(duì)象
本書既可作為高等院校金融科技相關(guān)課程的通用專業(yè)基礎(chǔ)教材, 也可作 為金融科技培訓(xùn)用書, 還可作為廣大金融科技愛好者和金融科技軟件開發(fā)人員自學(xué)金融科技的用書以及金融科技監(jiān)管部門的專業(yè)參考資料.
目 錄
向下滑動(dòng)查看所有內(nèi)容
正文搶先看
向下滑動(dòng)查看所有內(nèi)容
科學(xué)出版社數(shù)學(xué)教育
一起閱讀科學(xué)!
科學(xué)出版社│微信ID:sciencepress-cspm
專業(yè)品質(zhì) 學(xué)術(shù)價(jià)值
原創(chuàng)好讀 科學(xué)品味
科學(xué)出版社視頻號(hào)
硬核有料 視聽科學(xué)
關(guān)鍵詞:
版權(quán)與免責(zé)聲明:
1 本網(wǎng)注明“來(lái)源:×××”(非商業(yè)周刊網(wǎng))的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),本網(wǎng)不承擔(dān)此類稿件侵權(quán)行為的連帶責(zé)任。
2 在本網(wǎng)的新聞頁(yè)面或BBS上進(jìn)行跟帖或發(fā)表言論者,文責(zé)自負(fù)。
3 相關(guān)信息并未經(jīng)過(guò)本網(wǎng)站證實(shí),不對(duì)您構(gòu)成任何投資建議,據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
4 如涉及作品內(nèi)容、版權(quán)等其它問(wèn)題,請(qǐng)?jiān)?0日內(nèi)同本網(wǎng)聯(lián)系。