撰文(wen) | 吳坤諺
編(bian)輯 | 吳先(xian)之
(資料圖)
8月(yue)31日(ri),首批(pi)大模型(xing)產品將陸續通過(guo)《生成(cheng)式人工智能服(fu)務(wu)管理暫(zan)行辦法》(以下簡稱《暫(zan)行辦法》)備案,可正式上線面向公眾提供服(fu)務(wu)。
包括百度文心一(yi)言、抖音云雀(que)大(da)(da)(da)模(mo)(mo)(mo)(mo)型(xing)、智譜AI的(de)GLM大(da)(da)(da)模(mo)(mo)(mo)(mo)型(xing)、中科(ke)院(yuan)的(de)紫東太初大(da)(da)(da)模(mo)(mo)(mo)(mo)型(xing)、百川智能的(de)百川大(da)(da)(da)模(mo)(mo)(mo)(mo)型(xing)、商湯的(de)日(ri)(ri)日(ri)(ri)新大(da)(da)(da)模(mo)(mo)(mo)(mo)型(xing)、MiniMax的(de)ABAB大(da)(da)(da)模(mo)(mo)(mo)(mo)型(xing)、上海人(ren)工智能實驗室的(de)書生(sheng)通用大(da)(da)(da)模(mo)(mo)(mo)(mo)型(xing)、科(ke)大(da)(da)(da)訊飛(fei)星火(huo)大(da)(da)(da)模(mo)(mo)(mo)(mo)型(xing),以及華(hua)為、騰訊的(de)大(da)(da)(da)模(mo)(mo)(mo)(mo)型(xing)產(chan)品,共計11家。
懸而未決的(de)政策準(zhun)入已然落地。而通過(guo)備(bei)案的(de)主(zhu)體(ti)包含了(le)互聯網大廠、AI獨角獸、科研國(guo)家隊三方,也基本(ben)明確了(le)國(guo)家對不同主(zhu)體(ti)路徑的(de)肯定。
據(ju)上海申浩(hao)律師事務(wu)(wu)所(suo)對《暫(zan)(zan)行(xing)辦法(fa)》進行(xing)了解讀,《暫(zan)(zan)行(xing)辦法(fa)》的(de)規(gui)制重(zhong)點在于服(fu)(fu)務(wu)(wu)應用層的(de)信息內容(rong)安全,限制境外AIGC提(ti)供(gong)服(fu)(fu)務(wu)(wu)。更重(zhong)要的(de)是,《暫(zan)(zan)行(xing)辦法(fa)》對境外AIGC的(de)限制不(bu)包(bao)括垂直領(ling)域(yu)如工(gong)業、科(ke)研等(deng)場景(jing),只(zhi)要其不(bu)向公眾(zhong)提(ti)供(gong)服(fu)(fu)務(wu)(wu)。
換言(yan)之,目(mu)前(qian)《暫行辦法》備案(an)的(de)(de)(de)關(guan)鍵在(zai)于(yu)“向公眾提供服(fu)務”。這對于(yu)大模型企(qi)(qi)業而言(yan),顯然(ran)可以優先在(zai)面向C端的(de)(de)(de)模型應用(yong)中(zhong)積累用(yong)戶、數(shu)據,更(geng)利于(yu)產(chan)品打磨(mo)。而未通(tong)過備案(an)的(de)(de)(de)企(qi)(qi)業組織也(ye)不會(hui)因(yin)此在(zai)研發上遭(zao)遇阻礙,反而在(zai)能獲取海外AIGC調用(yong)能力的(de)(de)(de)情況下(xia),技(ji)術演(yan)進(jin)(jin)的(de)(de)(de)進(jin)(jin)程有(you)可能相對更(geng)快。
這或許會引發大模(mo)型玩家們形(xing)成(cheng)落(luo)地(di)偏(pian)向(xiang)與技術(shu)偏(pian)向(xiang)兩(liang)條(tiao)路徑。
更值得注(zhu)意的(de)是,通(tong)過備案(an)、面向(xiang)公眾(zhong)提供服務的(de)資質(zhi)顯然加快了金融、教育、法律等嚴肅場景(jing)的(de)模型(xing)落(luo)地(di)的(de)進(jin)程(cheng)。
以(yi)金融(rong)大(da)模型(xing)為例,金融(rong)領域(yu)合規先行(xing)的特點一(yi)度限制了模型(xing)能力(li)在實(shi)際業(ye)務中(zhong)的應用,導致(zhi)行(xing)業(ye)整體處于(yu)場景探索的階(jie)段(duan)。而今首批模型(xing)產品獲批開放,金融(rong)大(da)模型(xing)賽道的轉折(zhe)點也已到來。
明面(mian)務虛,私(si)下務實
今年3月,頭(tou)部財經(jing)資(zi)訊公司彭博社(she)發布了專門為金融領(ling)域打造的(de)(de)大模型BloombergGPT,試圖(tu)將其積累(lei)40年的(de)(de)財經(jing)資(zi)訊數據價值得(de)到釋放。
彼時(shi)的彭博社可(ke)能沒有(you)想到(dao),金融(rong)在大洋(yang)彼岸已經成為(wei)垂直領域(yu)大模型的搶(qiang)跑者。
盡管早在彭博(bo)社開(kai)始著(zhu)手搭建訓(xun)練BloombergGPT前,已有不(bu)少研究表(biao)明使用(yong)特定(ding)領(ling)域數據(ju)訓(xun)練的(de)垂直大(da)模型能在特定(ding)領(ling)域效果拔群,但當行業大(da)模型的(de)風吹到我們這時,有吸(xi)引力讓垂直領(ling)域公(gong)司(si)投身大(da)模型,而(er)非等待整(zheng)體解決方(fang)案的(de)似乎只有金融一家。
早在(zai)今年5月,度小滿便(bian)發(fa)布了自研(yan)千(qian)億參(can)數金(jin)融(rong)大模型“軒轅1.0”,目前“軒轅2.0”已(yi)開源。奇富科技、馬上金(jin)融(rong)、螞蟻集(ji)團等(deng)金(jin)融(rong)科技企業緊隨其后(hou),先后(hou)組(zu)建了自研(yan)大模型團隊并投身其中。
當然,金融領(ling)域外的(de)互聯網大(da)(da)廠與科(ke)技公司也希望就金融大(da)(da)模(mo)型分一杯羹,去年10月于科(ke)創主板上市的(de)大(da)(da)數據企業星環科(ke)技同在5月推(tui)出(chu)面向金融量化的(de)大(da)(da)模(mo)型“無涯”,騰訊(xun)云、科(ke)大(da)(da)訊(xun)飛、恒生電子(zi)等玩家也就金融領(ling)域的(de)風控(kong)、客服等細分賽道推(tui)出(chu)自己(ji)的(de)大(da)(da)模(mo)型解決方案。
金(jin)融一直是前(qian)沿科(ke)技(ji)希望(wang)結合與落地的(de)(de)垂直領域,甚至可以說金(jin)融史(shi)中暗(an)藏著(zhu)科(ke)技(ji)史(shi)的(de)(de)發展脈(mo)絡(luo)。早(zao)在(zai)2016年為國際金(jin)融穩(wen)定理事會(FSB)定義的(de)(de)金(jin)融科(ke)技(ji)迎來(lai)大(da)模型這(zhe)一輪(lun)風口,當下局面其(qi)實并不出人意料。
無(wu)論是面向消費者市(shi)場與小微企業的金融(rong)普(pu)惠、面向金融(rong)機(ji)構的智能(neng)投(tou)研還(huan)是面向投(tou)資者的大數據洞(dong)見,大模型在金融(rong)領(ling)域的應用都有充(chong)足空(kong)間嵌入(ru)并釋(shi)放價值。
大模型作為繼互聯網、移(yi)動互聯網后的第三波浪潮(chao),再(zai)次(ci)將金融機構拉(la)回同(tong)一起跑線。
有BloombergGPT這個基礎案(an)例(li)珠(zhu)玉在前,為金融(rong)大(da)模型(xing)的落地(di)指明方向。總體(ti)看(kan)來,目(mu)前金融(rong)大(da)模型(xing)的落地(di)方向有以下幾大(da)類,幾乎囊括了金融(rong)領域的方方面面:1、大(da)數據風(feng)控的進一步迭代(dai)
2、金融相(xiang)關文本生成(cheng),如財報、新聞、評論等
3、輔(fu)助決策的(de)智能(neng)投顧(gu)、智能(neng)投研與輔(fu)助運營的(de)智能(neng)客服
4、金(jin)融行業的“copilot”,包含債券發行、IPO、審計(ji)、評級等金(jin)融業務
當方(fang)向明朗之時(shi),落地(di)(di)成(cheng)果便成(cheng)為檢驗(yan)產品的(de)唯一標準。只(zhi)是我們可以在(zai)公開信息中聽到不(bu)(bu)(bu)小的(de)聲量,但卻沒法(fa)尋到落在(zai)實處(chu)的(de)案例。這并非玩家(jia)們“藏拙”,而(er)是金融大模型在(zai)落地(di)(di)途中不(bu)(bu)(bu)斷遭遇兩方(fang)面的(de)掣肘(zhou):技術不(bu)(bu)(bu)成(cheng)熟與場景(jing)不(bu)(bu)(bu)適(shi)配。
某公募基金(jin)經(jing)理(li)告訴光子星(xing)球,金(jin)融大模型真正能(neng)落地應用的功能(neng)較少,且(qie)落地場景集中在中后臺的客服、新聞播(bo)報等較為簡單的to C生成式(shi)內(nei)容上。
“面向C端投資(zi)者(zhe)的券(quan)商會(hui)應用多些(xie),我們(men)基(ji)(ji)金機(ji)構的監管更加嚴格,所以(yi)對創新會(hui)保持(chi)關注,這種新技術應用落地一般會(hui)滯后很多”,該基(ji)(ji)金經理稱(cheng)。
或(huo)許機(ji)構(gou)視(shi)角更(geng)為審慎,可(ke)是在互聯網大(da)廠視(shi)角下,金(jin)融大(da)模型的八字依然沒一撇。
一位騰訊高級架構師直言,金融大模(mo)型的應用還需(xu)要探索(suo)場(chang)景,明確的賽道僅智能客服、輔助編程等寥(liao)(liao)寥(liao)(liao)幾項。在“模(mo)型在具(ju)體(ti)場(chang)景的打(da)磨(mo)還有許(xu)多工程性問題未決”的前提(ti)下,應用與商業化還無(wu)從(cong)談起。
上述人士表示(shi),“技(ji)術成熟度、場(chang)景適配(pei)性(xing)兩(liang)個問題解決后,行業需求和產業共(gong)計之(zhi)間還需要找到一個投資回報的平衡點。應用推廣除了是(shi)技(ji)術問題外也是(shi)商業問題。”
或(huo)因如(ru)此(ci),盡管金融大模(mo)型的風吹了一陣又一陣,我們也未能在各大對應用與理(li)論(lun)侃(kan)侃(kan)而(er)談的發(fa)布會、論(lun)壇中看(kan)到真正(zheng)應用在金融場景的大模(mo)型案例,基本上是技術較為成熟(shu)的風控(kong)場景與封閉性較強(qiang)的智(zhi)能客服。
這并不奇怪,金(jin)融領域本(ben)身存在大(da)量(liang)時效(xiao)數(shu)據,結(jie)合當下大(da)模型普遍存在生(sheng)成內(nei)容不可解(jie)釋性,面對以嚴謹(jin)著(zhu)稱的金(jin)融行業,碰壁(bi)是可想(xiang)而知的事。
正(zheng)如國家金(jin)融(rong)與(yu)(yu)發展實(shi)驗(yan)室副(fu)主(zhu)任楊濤撰文指出那般,當人工智能大(da)模型(xing)在金(jin)融(rong)領域應用時,更(geng)需關(guan)注大(da)模型(xing)的可(ke)審計(ji)性、可(ke)解(jie)釋(shi)性等(deng)(deng)難題以及參與(yu)(yu)金(jin)融(rong)活動引(yin)發的風(feng)險(xian)特征變化(hua)、數(shu)(shu)據(ju)保護、責任分擔、合規邊界等(deng)(deng)問題,并強化(hua)數(shu)(shu)據(ju)倫(lun)理、算法(fa)倫(lun)理、主(zhu)體(ti)倫(lun)理、行為倫(lun)理等(deng)(deng)方面的治理。
合規先行者已經出現,但合規也無法完(wan)全解決金融(rong)大(da)模型的(de)(de)既有(you)問題。唯有(you)褪去光環(huan),我(wo)們才能更好地梳理金融(rong)大(da)模型的(de)(de)前世今生和未來(lai),找到大(da)模型在金融(rong)領(ling)域搶(qiang)跑的(de)(de)答案。
回歸提效本質
我們簡單回顧此(ci)前的(de)金融科技創新,不(bu)難發現(xian)暢(chang)想中的(de)大模型應用(yong)早已存(cun)在,不(bu)過一(yi)直處于“雛鳥”的(de)狀態。
例如金(jin)(jin)融(rong)(rong)科技業(ye)務中占核(he)心地位的智能投研便誕(dan)生(sheng)于2016年前后(hou),而迄(qi)今為止(zhi)稱(cheng)得(de)上成熟且(qie)步入商業(ye)化的應用還(huan)是(shi)處(chu)于較初級的階段——金(jin)(jin)融(rong)(rong)數據與資訊(xun)終端(duan),例如Wind、ifind等(deng)SaaS金(jin)(jin)融(rong)(rong)資訊(xun)軟件,定位是(shi)為業(ye)內外人士提供垂直信(xin)息平臺(tai)。
更進(jin)一步的應用也早已沒了聲音,就像曾被標普500以5.5億美金收購,如今泯然眾人的智能投研企業Kensho。
“金融數(shu)據信噪(zao)比(bi)太低了,和工業界的數(shu)據相比(bi)是數(shu)量(liang)級的差距(ju)。再考慮到(dao)金融數(shu)據的時序性與(yu)時效(xiao)性,無論(lun)是機器還是人(ren)都難以找到(dao)可持續(xu)的模式。AI可以根據風險(xian)邏輯去拿Beta(與(yu)市(shi)場(chang)相關的可預測收(shou)益),但一直(zhi)(zhi)很(hen)難拿到(dao)Alpha(與(yu)市(shi)場(chang)不相關的超(chao)額收(shou)益)”,一位業內人(ren)士直(zhi)(zhi)言。
據多位業內人(ren)士介紹,金融數據經NLP(自然語言(yan)處理)提取(qu)后(hou)交由機器(qi)學習,將成果以(yi)預輸入(ru)的投資(zi)規則(ze)在智能(neng)化交互(hu)界(jie)面輸出是(shi)幾年前的智能(neng)投研范式。大模型的引入(ru)不過(guo)是(shi)加(jia)強了機器(qi)學習的記憶(yi)、決策(ce)等能(neng)力,而且輸出的結果,按從業者(zhe)的話(hua)說是(shi)“跟蒙眼投資(zi)差不多”。
實際(ji)上(shang),大模型為(wei)金融行業帶來的(de)并(bing)不(bu)止是單獨業務能(neng)力(li)的(de)躍升,而是大模型的(de)“large”所提供的(de)泛化能(neng)力(li)。
金融機構在(zai)過去智能化進程中,早已在(zai)風控、投研、投顧(gu)、評(ping)級等業務(wu)線構建(jian)(jian)模(mo)(mo)型與(yu)中臺,輔(fu)助從業者推(tui)進業務(wu)的(de)同(tong)時也(ye)在(zai)不斷積累文本數據。而大模(mo)(mo)型的(de)出(chu)現提(ti)供(gong)了一個將打亂的(de)中臺整合為一體的(de)契機,既(ji)不需要多次建(jian)(jian)模(mo)(mo)也(ye)能打破各中臺之間的(de)數據孤(gu)島。
最終呈現是(shi)以金融大(da)模型(xing)為底座從(cong)而整(zheng)合并不斷延展機構的能力,好(hao)比阿里曾經在組織變革中(zhong)提(ti)出的“大(da)中(zhong)臺,小前(qian)臺”。
于金(jin)融(rong)機構(gou)而言,這不僅是效(xiao)率的(de)(de)提升,更是效(xiao)益(yi)的(de)(de)躍升。當(dang)然,如今距離這項堪(kan)稱“圣杯(bei)”的(de)(de)目(mu)標還有不小(xiao)的(de)(de)距離,而大模型(xing)相(xiang)對早(zao)先NLP、CV時期的(de)(de)能力演進已(yi)經在部分業務中得(de)以體現。
以ESG資(zi)管企業秩鼎為例(li),其創始人(ren)劉相峰稱(cheng),秩鼎的(de)金(jin)融(rong)大模(mo)型能力(li)應用正逐漸鋪開(kai),目前(qian)已在初級(ji)的(de)數(shu)據收集整理(li)與研究工作(zuo)上做到(dao)了人(ren)效躍升。雖然ESG與傳統(tong)金(jin)融(rong)存在一(yi)(yi)定(ding)距離,尤其是在數(shu)據信噪(zao)比方面,但(dan)作(zuo)為為數(shu)不多的(de)落地(di)案例(li),有(you)一(yi)(yi)定(ding)參考價值。
據了解,秩鼎的(de)內部模型訓(xun)練(lian)采用的(de)同樣是(shi)“預訓(xun)練(lian)——精(jing)調(STF)——對齊(RLHF)”的(de)范(fan)式,不(bu)同之處在于其(qi)實體(ti)識別系(xi)統可以將初步提取(qu)后的(de)ESG相關事件匹配到唯一主(zhu)體(ti)上。這對于模型知識圖譜的(de)構建,尤其(qi)是(shi)中文領(ling)域是(shi)一次(ci)不(bu)小的(de)進步。
結(jie)合(he)BloombergGPT僅(jin)以(yi)500億參數(shu)規(gui)模做出一(yi)(yi)(yi)定效果,我們或許可以(yi)下(xia)一(yi)(yi)(yi)個判斷:即金融大(da)模型(xing)乃至行業大(da)模型(xing)的(de)(de)落地收效如何,看(kan)的(de)(de)不一(yi)(yi)(yi)定是大(da)力煉丹,而且訓練精(jing)調以(yi)及應(ying)用(yong)工作流(liu)后(hou)的(de)(de)一(yi)(yi)(yi)些細小(xiao)動作。
例如軒轅2.0在常規(gui)垂直模型訓練混(hun)合(he)大量通用(yong)數據(ju),避免災難(nan)性遺(yi)忘導(dao)致模型“變笨(ben)”,還在此基礎(chu)上將預訓練的數據(ju)以及指令微調(diao)數據(ju)進一步(bu)混(hun)合(he),其論文中(zhong)將這種把預訓練和(he)精調(diao)融為一體(ti)的范式稱為Hybrid-Tuning。
未來的范(fan)式演進我們猶(you)未可(ke)知,但(dan)這細小的每一步都在為模型與金融行業提效,推動行業向(xiang)實處走去。
金融大(da)模型破曉前
金(jin)融(rong)大模(mo)型已經來到了(le)價值(zhi)釋放的前夕。
政(zheng)策(ce)準(zhun)入一定程度上(shang)打消了場景方面的(de)(de)顧慮,更多能力可以在實際業務中(zhong)得(de)到應用,而技術成熟度亦在細小(xiao)創新(xin)中(zhong)緩慢提升。在破曉前的(de)(de)微妙階段,金融(rong)大(da)模型的(de)(de)商業模式與格局的(de)(de)前瞻性思考是有必要的(de)(de)。
結合(he)《暫行(xing)辦法》中(zhong)對公眾開放(fang)(fang)服務(wu)的審慎態度(du),接(jie)下來(lai)一(yi)段時間的金融(rong)大(da)模型大(da)概率(lv)不會過早向C端釋放(fang)(fang)其能力(li),而(er)是在(zai)內部業務(wu)的應用(yong)試錯中(zhong)迭代。
這意味(wei)著(zhu)當(dang)下各個機(ji)構的(de)研(yan)究(jiu)(jiu)部門更(geng)多(duo)會“刀刃向內”,試圖于工(gong)作(zuo)流中提升研(yan)究(jiu)(jiu)工(gong)作(zuo)的(de)效(xiao)率和效(xiao)益(yi),圍繞研(yan)究(jiu)(jiu)業務本身展開(kai)。而且出于數(shu)據(ju)隱(yin)私等方面(mian)的(de)考量,在(zai)模(mo)型(xing)部署上會更(geng)看(kan)重(zhong)私有化(hua)部署甚(shen)至(zhi)是端側部署。
即使存在自(zi)主可(ke)控的(de)(de)(de)強需求,讓每一家金(jin)融(rong)機(ji)構(gou)都(dou)從零開始儲備算力、招募人(ren)才并訓練機(ji)構(gou)的(de)(de)(de)大模(mo)(mo)型(xing)(xing),也顯然是(shi)不現(xian)實(shi)的(de)(de)(de)。更大的(de)(de)(de)可(ke)能(neng)是(shi)由資(zi)源更多的(de)(de)(de)主體或是(shi)基于某一底座或是(shi)完全自(zi)主構(gou)建出(chu)金(jin)融(rong)大模(mo)(mo)型(xing)(xing),再以服務的(de)(de)(de)方式(shi)就模(mo)(mo)型(xing)(xing)做(zuo)私有化部署。
所以我(wo)們也不(bu)難發現度小(xiao)(xiao)滿、奇富(fu)、馬上金融(rong)、螞蟻等金融(rong)科技(ji)頭部紛紛投(tou)身(shen)自(zi)研模(mo)型的原因(yin):并非(fei)只是自(zi)身(shen)已有(you)充分(fen)的技(ji)術與數據儲備,而是前方有(you)大量(liang)存在確(que)定性需(xu)求的中小(xiao)(xiao)金融(rong)機構客戶。
B端(duan)應(ying)用方面(mian),接入模型能力后的工作(zuo)流勢(shi)必也將發(fa)生(sheng)改變,就像Kensho曾揚言“用AI干掉證券分析(xi)師”,屆時金融機構的組織(zhi)制度也將生(sheng)變。
當機(ji)構內技(ji)術(shu)團隊不斷壯大,技(ji)術(shu)演進讓內部效率達到一定(ding)高度后(hou)(hou),屆(jie)時金融大模型才可(ke)(ke)以(yi)強調業務的外部性。將價值釋(shi)放面向的群體由(you)B端(duan)(duan)轉為C端(duan)(duan),例如幻覺問題可(ke)(ke)控后(hou)(hou),具備(bei)可(ke)(ke)解(jie)釋(shi)、可(ke)(ke)溯源的AI投資(zi)能(neng)力。不過這一階段的到來顯然還需要很長的時間。
無論(lun)如何(he),合規進程在《暫行(xing)辦(ban)法》的(de)實施與備案(an)(an)中已前(qian)行(xing)一(yi)大步。冰山之下(xia),各家金融大模型已蓄(xu)勢待發,我(wo)們(men)很可能(neng)在接(jie)下(xia)來的(de)9月(yue)感受到國內大模型行(xing)業,繼(ji)4月(yue)密集(ji)發布、6月(yue)垂直轉向后的(de)一(yi)個新節(jie)點。大模型的(de)下(xia)一(yi)戰——金融,市場等待玩家們(men)的(de)答案(an)(an)。