藍(lán)鯨TMT頻道7月7日訊,在2023世界人工智能大會(WAIC)上,商湯科技推出 “商湯日日新SenseNova”大模型體系的多方位升級,以及在該體系下的一系列大模型產(chǎn)品更新和落地成果。
此外,商湯也著重介紹并展示了其大模型技術(shù)自正式發(fā)布以來與產(chǎn)業(yè)各方的應(yīng)用實(shí)踐,包括商湯絕影最新打造的智能座艙產(chǎn)品和車路云協(xié)同交通體系等,以及在金融、醫(yī)療、電商、移動終端、產(chǎn)業(yè)園區(qū)等行業(yè)生產(chǎn)實(shí)踐中的落地應(yīng)用。
(資料圖片)
商湯科技董事長兼CEO徐立表示:“大模型的突破掀起了人工智能的新一輪技術(shù)革命,隨之而來的是產(chǎn)業(yè)需求呈現(xiàn)爆炸式增長,全新的應(yīng)用場景和應(yīng)用模式正迅速涌現(xiàn)。商湯希望通過‘大模型+大裝置’持續(xù)推動AI基礎(chǔ)設(shè)施能力的躍進(jìn)提升,不僅打造通用能力更加強(qiáng)大的基礎(chǔ)模型,也進(jìn)一步高效融合不同垂直領(lǐng)域的專業(yè)知識,構(gòu)建更懂行業(yè)、更具專長的專業(yè)大模型,從根本上降低大模型的下游應(yīng)用成本和門檻?!?/p>
商湯表示,寓意“模型迭代速度和處理問題的能力可以日日更新”,商湯大模型體系在其“大模型+大裝置”的AGI戰(zhàn)略布局下,正進(jìn)行著高速迭代。作為千億級參數(shù)的自然語言處理模型,商湯商量SenseChat 2.0版本突破了大語言模型輸入長度的限制,并推出不同參數(shù)量級的模型版本,可適配移動端、云端等不同終端及場景的應(yīng)用需求,降低部署成本。商湯的自研生成式大模型商湯秒畫SenseMirage 3.0的模型參數(shù)從今年4月首次發(fā)布以來的10億提升至70億量級,能夠?qū)崿F(xiàn)專業(yè)攝影級的圖片細(xì)節(jié)刻畫。
據(jù)介紹,不僅如此,商湯如影SenseAvatar 2.0數(shù)字人生成平臺相較1.0版本的語音和口型流暢度提升30%以上,實(shí)現(xiàn)4K高清視頻效果,并帶來AIGC生成形象及數(shù)字人歌唱功能。此外,商湯瓊宇SenseSpace 2.0的空間重建效率提升20%,渲染性能提升50%,每100平方公里場景的建圖時間僅需38小時即可完成(1200 TFLOPS/秒算力支持);而商湯格物SenseThings 2.0對小物體的紋理及材質(zhì)還原達(dá)到毫米級精細(xì)度,并突破對高反光和鏡面物體的采集難題。
在金融領(lǐng)域,商湯與銀行、保險、券商等客戶展開合作,利用數(shù)字人進(jìn)行智能客服、智慧營銷等工作,并通過接入大語言模型能力,提供投研分析、研報撰寫等新功能。此外,掛載金融知識庫后,還能100%基于客戶的產(chǎn)品說明進(jìn)行內(nèi)容問答輸出,并實(shí)現(xiàn)信息及時更新。
在醫(yī)療場景,商湯基于海量醫(yī)學(xué)知識和臨床數(shù)據(jù)打造了中文醫(yī)療語言大模型“大醫(yī)”,提供導(dǎo)診、問診、健康咨詢、輔助決策等多場景多輪會話能力,未來也即將支持醫(yī)學(xué)圖像、文本、結(jié)構(gòu)化數(shù)據(jù)等多模態(tài)綜合分析,并可不斷提升醫(yī)療語言理解和推理能力。
結(jié)合商量2.0和秒畫3.0的綜合能力,商湯還為移動終端客戶帶來多種智能交互解決方案,包括針對信息獲取的問答交互,針對生活場景的知識交互,針對語言和圖像生成的內(nèi)容交互等,依托商湯大模型的輕量化版本,可實(shí)現(xiàn)在移動終端的部署和運(yùn)行。
面向線下場景,商湯通過大模型能力為電網(wǎng)巡檢帶來長尾故障識別、復(fù)雜缺陷判斷等智能解決方案?;诃傆?.0的空間重建,商湯為濟(jì)南馬山鎮(zhèn)區(qū)域開發(fā)、合肥中國視界園區(qū)、上海瑞金醫(yī)院等打造實(shí)景空間的數(shù)字孿生,提升運(yùn)營管理效率。在珠寶行業(yè),依托格物2.0商湯為珠寶品牌進(jìn)行珠寶首飾復(fù)刻。
在線上短視頻、直播平臺,商湯如影2.0生成的數(shù)字人正得到廣泛應(yīng)用,商湯還與多個頭部企業(yè)達(dá)成渠道戰(zhàn)略合作,共建“云+AIGC+短視頻直播”生態(tài)。
在智能汽車領(lǐng)域,商湯絕影智能座艙、智能駕駛、車路協(xié)同等行業(yè)應(yīng)用也已在大模型的加持下取得成績。在智能座艙里,商湯通過視覺、聽覺等多模態(tài)融合,感知用戶需求,通過標(biāo)簽化數(shù)據(jù)記錄用戶習(xí)慣和偏好,提供專屬個性服務(wù)。同時,商湯還通過大模型的環(huán)境理解、邏輯思維和內(nèi)容生成能力,帶來“車艙大腦”,以及可支持形象、語音快速定制的數(shù)字人進(jìn)行擬人化交互。
車艙外,依托 “大模型+大裝置”的能力,商湯絕影部署端云協(xié)同,統(tǒng)一流量入口,支持私有化部署及千萬量級的應(yīng)用需求。在近期的CVPR 2023中,商湯及聯(lián)合實(shí)驗(yàn)室還首個提出感知決策一體化的自動駕駛通用大模型UniAD,開創(chuàng)了以全局任務(wù)為目標(biāo)的自動駕駛大模型架構(gòu)。基于此,商湯打造車路云協(xié)同的交通體系,憑借多模態(tài)多任務(wù)通用大模型開發(fā)路側(cè)視覺感知大模型,結(jié)合瓊宇2.0及格物2.0構(gòu)建智能交通孿生與仿真,并利用商量2.0的感知推理和人機(jī)交互能力,推動車路云向大模型對話式交互的演進(jìn) 。
關(guān)鍵詞:
版權(quán)與免責(zé)聲明:
1 本網(wǎng)注明“來源:×××”(非商業(yè)周刊網(wǎng))的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),本網(wǎng)不承擔(dān)此類稿件侵權(quán)行為的連帶責(zé)任。
2 在本網(wǎng)的新聞頁面或BBS上進(jìn)行跟帖或發(fā)表言論者,文責(zé)自負(fù)。
3 相關(guān)信息并未經(jīng)過本網(wǎng)站證實(shí),不對您構(gòu)成任何投資建議,據(jù)此操作,風(fēng)險自擔(dān)。
4 如涉及作品內(nèi)容、版權(quán)等其它問題,請?jiān)?0日內(nèi)同本網(wǎng)聯(lián)系。