ChatGPT短時間內(nèi)的流量爆發(fā),在眾多創(chuàng)業(yè)者心里激起漣漪。今年2月,原搜狗CEO、現(xiàn)百川智能創(chuàng)始人兼CEO王小川在微博上這樣評價OpenAI的成功:“首先是技術(shù)理想主義的勝利。中國需要自己的OpenAI,就需要技術(shù)理想主義。我相信中國能誕生自己的OpenAI。” 于是,兩個月后,百川智能誕生了。宣告成立后的百川智能動作頻頻,短短4個月內(nèi)就發(fā)布了三款中文大模型,近日,第四款大模型——Baichuan 2開源大模型也由王小川正式對外公布,該公司追趕ChatGPT的腳程逐漸加快。然而,大模型領(lǐng)域匯聚了國內(nèi)外互聯(lián)網(wǎng)巨頭,且是一個十分“燒錢“的行業(yè),百川智能作為一個沒有強大資本靠山的新生兒,想要復(fù)制“搜狗”曾經(jīng)的輝煌,必然要經(jīng)過“千錘百煉”。
“五道口守門員”再創(chuàng)業(yè)
離開搜狗之后,王小川的去向一直備受外界關(guān)注,直到今年4月,才由他本人揭開真相。
【資料圖】
王小川成立AI大模型公司“百川智能”,希望借助語言AI的突破,構(gòu)建中國最好的大模型底座。他的志向并不僅限于做“中國的OpenAI”,而是“建立世界級的視野和技術(shù)品質(zhì),讓中國享有世界級的產(chǎn)品,產(chǎn)生有世界影響力的技術(shù)的突破,進而服務(wù)海外?!?/p>
能夠在短短的時間內(nèi)籌劃起一家新公司,是因為王小川已經(jīng)在資金和人才方面做好了一定的準備。據(jù)他介紹,百川智能早前已經(jīng)獲得了5000萬美元啟動資金,初步搭建起包括搜狗、百度等技術(shù)骨干在內(nèi)的團隊,并獲得了包括清華大學計算機系教授,中國工程院院士,中國科學院院士等眾多中國人工智能學術(shù)界領(lǐng)軍人物的支持。
除了5000萬美元啟動資金,天眼查數(shù)據(jù)顯示,今年5月,百川智能還完成了一筆天使輪融資,2023年最豪華投資機構(gòu)陣容匯聚,這一輪融資由騰訊、小米、金山、慕華資本、清華控股、好未來、渶策資本、深創(chuàng)投、紅點中國、卓源資本、眾為資本、愉悅資本、順為資本、心資本等十余家聯(lián)合投資,具體融資金額不詳。
然而,百川智能和以前的搜狗所面臨的境遇并不相同,搜狗的誕生有當年的搜狐作為靠山,又有阿里巴巴和騰訊后續(xù)的戰(zhàn)略入股,且當時的輸入法市場并不像現(xiàn)在的大模型市場,剛剛興起就進入“百模大戰(zhàn)”的階段。
早年間,在王小川的主持下,搜狗創(chuàng)先后開發(fā)出搜狗搜索、搜狗輸入法、搜狗瀏覽器等產(chǎn)品, 并在這幾大領(lǐng)域創(chuàng)造過“輝煌”,尤其是在阿里巴巴注資,搜狗單獨運營之后。據(jù)公開報道,10年前,搜狗輸入法在國內(nèi)的市場份額曾達到87.8%,排名第一;搜狗搜索覆蓋2億用戶數(shù),覆蓋率達45%,排名第三;搜狗高速瀏覽器用戶覆蓋率達24.93%,排名第三。
2017年,王小川帶領(lǐng)搜狗在美國紐交所上市,輝煌達到頂峰,但此后,搜狗再也講不出新故事,加上成本高昂導(dǎo)致的虧損,其運營日益維艱,不得不賣身騰訊。2021年10月15日,王小川宣布卸任搜狗CEO,2021年12月2日,王小川退出搜狗股東行列。
此后入局AI領(lǐng)域,其實在王小川早年的言語之中已見端倪。在搜狗時,王小川就多次表達過對人工智能的看重:“搜索幫助用戶更好地獲取信息,輸入法幫助用戶更好地表達信息,而無論是獲取信息還是表達信息,都離不開對語言的理解,這也正是搜狗人工智能戰(zhàn)略的核心”、“語言是人工智能皇冠上的明珠”……
在ChatGPT大火之后,王小川又指出,搜狗輸入法和搜狗搜索的數(shù)據(jù)制備和產(chǎn)品形態(tài),與ChatGPT接近,都是把互聯(lián)網(wǎng)上的全部語言數(shù)據(jù)收集、清洗,壓縮成數(shù)據(jù)并構(gòu)建超級產(chǎn)品。
有意思的是,王小川一直被稱為“五道口守門員”,從在清華大學的求學,到在搜狐和搜狗的創(chuàng)業(yè),再到如今的百川智能,他始終沒有離開這個創(chuàng)業(yè)者的寶藏之地。
大模型戰(zhàn)場搏殺
盡管一直以來,很多人說王小川并不適合作為一個創(chuàng)業(yè)者的身份,更符合一個職業(yè)經(jīng)理人的定位,但他愿意通過百川智能證明自己在創(chuàng)業(yè)方面的才能。在今年的一次媒體交流會上,王小川曾坦誠回答:“我習慣了一切 ready才公布,我承認這有職業(yè)經(jīng)理人的慣性思維,但我走出來了,所以先選擇向大家公布?!?/p>
創(chuàng)辦百川智能后,王小川的步子邁得很大,走得也很快。
在近日Baichuan 2開源大模型發(fā)布之前,百川智能已經(jīng)連續(xù)發(fā)布了包括:Baichuan-7B、Baichuan-13B、Baichuan-53B在內(nèi)的三款中文大模型,并且成為首批通過《生成式人工智能服務(wù)管理暫行辦法》備案,成為可以正式面向公眾提供服務(wù)的企業(yè),這在今年創(chuàng)立的大模型公司中是唯一一家。
而在Baichuan 2開源大模型的發(fā)布會上,王小川也在不斷強調(diào)自家產(chǎn)品的技術(shù)優(yōu)勢,將Baichuan2與LLaMA2等同尺寸模型競品進行了多方面的比較,并宣布本次開源的兩個模型在各大評測榜單上的表現(xiàn)優(yōu)秀,在MMLU、CMMLU、GSM8K等幾大權(quán)威評估基準中,以絕對優(yōu)勢領(lǐng)先LLaMA2。
據(jù)介紹,新發(fā)布的Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基于 2.6萬億高質(zhì)量多語言數(shù)據(jù)進行訓練,在保留了上一代開源模型良好的生成與創(chuàng)作能力,流暢的多輪對話能力以及部署門檻較低等眾多特性的基礎(chǔ)上,兩個模型在數(shù)學、代碼、安全、邏輯推理、語義理解等能力有顯著提升。
除了大模型的研發(fā),王小川也在加快應(yīng)用層面的動作。這源于他的一趟美國之行,在和OpenAI等眾多大模型從業(yè)者聊完后,王小川認為應(yīng)該“在理想上慢一步,在落地上快三步”。按照他的規(guī)劃,百川智能在今年三季度發(fā)布500億參數(shù)模型,四季度發(fā)布千億參數(shù)模型,2024年一季度發(fā)布超級應(yīng)用。
不過,想要將百川智能打造成為中國的OpenAI,要過的,不止自己這道坎兒,還有面前的幾大互聯(lián)網(wǎng)巨頭。截至目前,阿里巴巴、騰訊、百度均已實現(xiàn)大模型的落地,且它們的資金和技術(shù)優(yōu)勢是顯而易見的。
文淵智庫創(chuàng)始人王超就此對《華夏時報》記者表示,“其實在這一波大模型浪潮里,創(chuàng)業(yè)公司是非常不占有優(yōu)勢的,百川智能和光年之外都一樣,當然現(xiàn)在光年之外已經(jīng)被收購了。沒有大量數(shù)據(jù),也無法背靠巨頭獲得足夠的芯片支撐,Open AI的崛起是借助了微軟的算力資源和數(shù)據(jù)優(yōu)勢,百川智能從無到有要面臨很大的競爭壓力。當然這并不意味著初創(chuàng)公司就完全沒有機會,只不過作為一家初創(chuàng)公司,依賴一個巨頭去提供生存發(fā)展必需的養(yǎng)料、提供一定的庇護,是很有必要的?!?/p>
當然,王超還指出,百川智能最終在大模型以及AI領(lǐng)域的地位如何,最關(guān)鍵的還是產(chǎn)品技術(shù)的成熟度、客戶體驗是否改進、在與同類競品對比中是否存在優(yōu)勢、大模型能不能提高生產(chǎn)力,然后才能考慮后續(xù)擴展到硬件和更多場景應(yīng)用的事。
而作為一個在互聯(lián)網(wǎng)領(lǐng)域叱咤風云20多年的人,王小川對于百川智能的未來還是很有信心的,“在美國做開源大模型或做通用已沒有懸念,投資也已經(jīng)明確,但在中國不是,國內(nèi)誰能做最好的大模型現(xiàn)在沒有定論,大家都有爭取的機會,而且不一定落在大廠里面?!?/p>
責任編輯:黃興利 主編:寒豐
關(guān)鍵詞:
版權(quán)與免責聲明:
1 本網(wǎng)注明“來源:×××”(非商業(yè)周刊網(wǎng))的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責,本網(wǎng)不承擔此類稿件侵權(quán)行為的連帶責任。
2 在本網(wǎng)的新聞頁面或BBS上進行跟帖或發(fā)表言論者,文責自負。
3 相關(guān)信息并未經(jīng)過本網(wǎng)站證實,不對您構(gòu)成任何投資建議,據(jù)此操作,風險自擔。
4 如涉及作品內(nèi)容、版權(quán)等其它問題,請在30日內(nèi)同本網(wǎng)聯(lián)系。