AI 大模型降溫了？資本表示還沒到時候當前要聞

來源： ZAKER科技2023-06-28 20:23:48

隨著 ChatGPT 火遍全球，國內(nèi)科技圈也打響了 " 千模大戰(zhàn) "，不同場景、語言、行業(yè)的 AI 大模型層出不窮，產(chǎn)品形態(tài)覆蓋移動端與 PC 端。資本也久違地捕捉到了類似 10 年前移動互聯(lián)網(wǎng)曾帶來的變革機遇，單筆融資規(guī)模動輒破億美元，不斷刷新獨角獸的誕生周期……

當前，國內(nèi)生成式 AI 創(chuàng)業(yè)與產(chǎn)品研發(fā)熱火朝天，互聯(lián)網(wǎng)和云服務大廠、傳統(tǒng) AI 企業(yè)、高校及科研機構、大數(shù)據(jù)及算力提供商紛紛入局。幾十上百家公司喊出 " 夢之隊 " 的口號，誓要成為中國版的 OpenAI，造出自己的 ChatGPT。

據(jù)不完全統(tǒng)計，在已持續(xù) 4 個多月的大模型創(chuàng)業(yè)狂潮中，多達 60 款類 GPT 大模型已經(jīng)或即將面世。除了擁有深厚技術積淀與資金實力的大廠以各自的產(chǎn)品吊足觀眾胃口，眾多大廠高管與互聯(lián)網(wǎng)老兵的躬身下場也讓這場軍備競賽具備了更多看點：一方面，騰訊、華為、京東、螞蟻等巨頭系大模型布局繼續(xù)加碼；另一方面，百川智能等來自創(chuàng)業(yè)公司隊伍的生成式 AI 探索也已取得初步成果。

(資料圖片僅供參考)

生成式 AI 時代，不同技術場景中的底層技術變量將帶來怎樣的價值，其中蘊含著怎樣的創(chuàng)業(yè)機會，又包含哪些成功的要素與難點？動點科技收集了來自風投與相關創(chuàng)業(yè)公司基于實戰(zhàn)的洞見以饗讀者。

底層基礎變量啟動系統(tǒng)創(chuàng)新

從 Stable Diffusion 的開源到 ChatGPT 的問世，生成式 AI 在各個領域的范式迭代已成為共識，AIGC 可謂是想象力加生產(chǎn)工具的雙重組合。通過多輪交互，用戶與模型的交互深度已大幅度增加，新型的交互形式的引入大大降低了技術的交互成本，可謂是小樣本大智能。

金沙江創(chuàng)投主管合伙人張予彤認為，其中底層的變化主要在于計算成本與推理成本。

正如神經(jīng)網(wǎng)絡隨著算力的發(fā)展愈發(fā)深度，大模型的不斷調(diào)優(yōu)與迭代也依賴著算力的提升。據(jù)報道，作為一個萬億參數(shù)的模型，GPT-4 是用 2 萬張英偉達 A100 顯卡進行 8 個月訓練的結果。未來若達到英偉達 H100 芯片等更高級別的算力，其耗費的顯卡數(shù)量將會明顯降低。因為萬卡的階段已經(jīng)給運維帶來了很大壓力，每小時都需要至少重啟一張顯卡。面對這種瓶頸，純粹的規(guī)?；o模型帶來的增益將呈現(xiàn)遞減趨勢。只有底層算力的提升才能推動數(shù)據(jù)處理能力的攀升并進而提高訓練數(shù)據(jù)的規(guī)模。

效果驚艷的模型問世之后，從業(yè)者也不得不開始關注模型的推理成本。今天，ChatGPT 在下游廣泛的通用任務中都有較好的表現(xiàn)，并由此開啟了大量的推理應用，未來有望從云端拓展至 H 端、移動端，并降低技術成本使之適配更多的商業(yè)場景。

2014 年起，五源資本開始投資于深度學習類 AI 賽道。五源資本合伙人劉凱認為，今天的這一波 AI 創(chuàng)新與十年前的區(qū)別主要在于，十年前的創(chuàng)新主要是由 AI 教父辛頓等人帶動的點狀創(chuàng)新，推動了行業(yè)的發(fā)展并快速商業(yè)化。而今天以OpenAI 為代表的創(chuàng)新其實是一種系統(tǒng)化的創(chuàng)新，在多個維度上發(fā)生了快速的迭代與突破。

點狀創(chuàng)新會很快在點上收斂，對應的結果就是其他層面的同質(zhì)化內(nèi)卷，例如不同企業(yè)高度雷同的 CV 與 NLP 客服產(chǎn)品。而如今的 GPT4 從底層模型機制到上層應用的 prompt，借助了很多成熟的 infra 公司，與開源界關系密切，帶來了大量的開源者，包含了大量的數(shù)據(jù)集。

也有創(chuàng)投人士擔憂這一次的 AI 創(chuàng)新是否也會如十年前那樣，先帶來很高的期待而后繼乏力。對此，劉凱表示，不必有此擔憂，因為 ChatGPT 將重心放在生態(tài)建設，更多地促使用戶去使用 API 這種難以計算用戶時長的端口。并且，后者也更著眼于生態(tài)創(chuàng)新，從各個方面吸引與籠絡開發(fā)者和用戶，ChatGPT 以及相關的 AI 大模型還遠沒到降溫的時候。

落地前：層層壁壘與重重挑戰(zhàn)

從生產(chǎn)力工具到交互形式再到交付成本，這一輪 AI 創(chuàng)新帶來了不可忽視的變革，而這種影響還將隨著技術的逐步落地被繼續(xù)放大。而在此過程中，AI 大模型的落地還存在一些壁壘與挑戰(zhàn)。

面壁智能 CEO 李大海認為，訓練一個小型預訓練模型并沒有太大難度，這也是國內(nèi)會出現(xiàn) " 千模大戰(zhàn) " 底層原因之一，真正的難度在于要真正做出一個性能達到當前 GPT4 甚至更高水準的模型。他分享了 AI 大模型在預訓練階段的一些有待突破的壁壘，主要包括算力、數(shù)據(jù)、訓練難度以及對 infra 的要求。

訓練一個 GPT3.5 水平的模型至少需要 1000 張英偉達 A100 或 H800 顯卡，其背后成本十分高昂，而隨著模型參數(shù)規(guī)模的上升，其試錯成本也水漲船高，并需要海量的、包含多模態(tài)數(shù)據(jù)的支撐。同時，雖然行業(yè)已逐步沉淀出一些訓練的方法論，但仍無法避免梯度爆炸等系統(tǒng)性問題的產(chǎn)生，這對于 AI 訓練工程師快速排查問題的能力提出了極高的要求。如何讓 infra 能夠更好地與模型結合，更好地容錯，也是一個很高的門檻。

此外，效果與成本的平衡、安全可控也是大模型落地的挑戰(zhàn)所在。基于 Transformer 的大模型已實現(xiàn)了很大的突破，但 Transformer 架構的大模型是否能達到 AGI 的水平還是個未知數(shù)。如果沒有更高效的架構出現(xiàn)，成本將限制我們對于大模型性能的追求。在復雜分裂的文化背景下，如何保證模型的可控性并使之在一個地區(qū)進行有效的商業(yè)化落地，已成為比技術更令人頭疼的問題。

關于 AI 大模型在工具鏈層的挑戰(zhàn)，潞晨科技創(chuàng)始人尤洋教授表示，下層的 GPU 硬件等基礎設施決定了上層的處理方法，而上層的方法反之也將產(chǎn)生更深遠的影響。當前訓練大模型使用的 Adam 優(yōu)化器本質(zhì)屬于非凸優(yōu)化，難以找到全局最優(yōu)解，現(xiàn)在收斂到的只是一些局部最優(yōu)點。

"AI 模型是不是越大越好，參數(shù)量達到 5000 億、6000 億乃至 7000 億、8000 億之后會不會產(chǎn)生瓶頸？這些都還無法從科學角度進行驗證。神經(jīng)網(wǎng)絡模型也是一個非凸函數(shù)，當全球計算機理論學科最優(yōu)的普林斯頓大學教授都無法證明 5 層神經(jīng)網(wǎng)絡的多點性，遑論比較 500 億參數(shù)與 5000 億參數(shù)大模型的優(yōu)劣。" 即便是 OpenAI 也只是在進行一些實驗性的探索，沒有人能夠證明千億級參數(shù)的大模型是否一定優(yōu)于百億級。

尤洋相信，未來隨著計算范式變革，將出現(xiàn)比 Adam 優(yōu)化器快成千上萬倍的選擇，并帶來成本的大幅度下降，以至于用幾十個服務器訓練一兩周就能達到今天 GPT4 的效果。

Gonex CEO 溫夢飛觀察到，當下很多 AI 大模型在應用層提供的解決方面較為表面、容錯率較低且不受控。例如一些聊天機器人沒有對對話內(nèi)容進行任何分析處理，這在行業(yè)中是不可接受的，因為在給定的流程與場景下，不能讓模型無限制地生成內(nèi)容。

基于 Gonex 進行的一些早期研究，大模型的產(chǎn)業(yè)應用主要有兩方面的挑戰(zhàn)，一是缺乏商業(yè)化的 PMF，大多數(shù)現(xiàn)有的模型應用沒有解決實際的問題，因此也沒有付費的空間。這涉及對流程的再造以及商業(yè)場景的適配，國內(nèi)尚未找到對應的完整體系與標準；二是很多的模型應用還是比較薄，體現(xiàn)沒有整理出自己的行業(yè) know-how，僅靠模型自身進行迭代行業(yè)數(shù)據(jù)它沒有整理出來，以及純線上的交付無法體現(xiàn)服務的能力。

溫夢飛認為大模型的行業(yè)應用需要從三個方向考慮，即抽象與提煉自己的行業(yè) know-how，增加獨有的交付方式，和以自身模型的邏輯、意圖識別、流程再造去解決實際問題。

工具鏈與商業(yè)生態(tài)演變路徑

在大模型創(chuàng)業(yè)的成功要素中，算法、算力、數(shù)據(jù)、資本的重要性顯而易見，而生態(tài)這一要素也正隨著技術范式的變化發(fā)生改變。MLOps（機器學習運維）是 AI 掘金時代的 " 鏟子 "，從模型到生產(chǎn)應用全面助力著 AI 模型的落地生花。

劉凱發(fā)現(xiàn)，不同于上一代 Machine Learning 的模式能力，即依托強化學習去做一些預測性的應用，例如電商平臺的商品推薦及短視頻平臺的內(nèi)容推薦。這一代的生成式AI 解決的是完全不一樣的問題，它對數(shù)據(jù)的理解與使用環(huán)節(jié)都非常不同，具備了以前所有的軟件公司都不具備的能力。他相信，這一代新的范式將孕育很多新的工具和新的公司。

除了工具鏈生態(tài)的變化，大模型的商業(yè)生態(tài)也發(fā)生著劇變，例如在文生圖領域，Stable Diffusion 和 Midjourney 進行著拉鋸戰(zhàn)，在語言模型領域，LLaMA 等項目遍地開花，幾乎人手一個大模型。

對此，張予彤認為文生圖模型與大語言模型的差異不僅在于模態(tài)的區(qū)別，更重要的是文字可能是人類總結與傳播知識的首選媒介，人類的通用知識與常識通常也留存在語言文字中。正如在 CV 領域的 Killer App 屈指可數(shù)，因此，大語言模型在未來仍然是不可忽略的。

未來，大模型還將向文生視頻的方向發(fā)展，例如 Midjourney 的 5.2 版本也推出了一個可以無限 zoom out 的功能。但隨著大模型模態(tài)和信息的升維，其理解人類通識的能力也將成為技術的關鍵點。

關鍵詞：

責任編輯：sdnew003

返回首頁返回時事觀瀾首頁

熱文排行

財經(jīng)

綜合

黃金360

北京再發(fā)高溫黃色預警！未來3天最高氣溫將達35℃以上
【環(huán)球聚看點】2023年養(yǎng)老金上漲3.8%廣東如何調(diào)整？今年調(diào)整方案何時出？
儲蓄國債可以記名嗎國債安全嗎
豪砸40億！華民股份加碼高效N型單晶硅棒及硅片項目
左邊肋骨下隱隱的疼怎么辦_左邊肋骨下隱隱的疼

亚洲一久久久久久久久,国产免费天天看高清影视在线,精品人妻伦九区久久aaa片,性荡视频播放在线视频

AI 大模型降溫了？資本表示還沒到時候當前要聞

相關新聞

熱文排行

財經(jīng)

綜合

黃金360

關注

熱門主題

綜合熱門

熱門主題

科技熱門

熱門主題

亚洲一久久久久久久久,国产免费天天看高清影视在线,精品人妻伦九区久久aaa片,性荡视频播放在线视频

AI 大模型降溫了？資本表示還沒到時候 當前要聞

相關新聞

熱文排行 財經(jīng) 綜合 黃金360

關注 熱門主題

綜合熱門 熱門主題

科技熱門 熱門主題

AI 大模型降溫了？資本表示還沒到時候當前要聞

熱文排行

財經(jīng)

綜合

黃金360

關注

熱門主題

綜合熱門

熱門主題

科技熱門

熱門主題