拓爾思(300229)6月14日發(fā)布投資者關系活動記錄表,公司于2023年6月13日接受13家機構調研,機構類型為保險公司、其他、基金公司、海外機構、證券公司、陽光私募機構。 投資者關系活動主要內容介紹: 一、公司副總經(jīng)理、董事會秘書李黨生先生就公司業(yè)務發(fā)展情況、近期經(jīng)營情況及未來戰(zhàn)略規(guī)劃進行介紹。 二、參會機構提問及回答
(資料圖片僅供參考)
問:請問公司專業(yè)大模型研發(fā)進度如何?預計何時發(fā)布?
答:公司拓天專業(yè)大模型正在研發(fā)測試過程中,預計于2023年6月底前推出,具體時間請留意公司發(fā)布的相關信息。
問:公司認為大模型在場景落地中存在哪些挑戰(zhàn)?
答:大模型技術在場景落地中的挑戰(zhàn),主要集中在質量、可控、時效和成本四個層面。在質量層面,個人用戶對事實類問答錯誤反饋的容忍度要高于企業(yè)用戶,在為企業(yè)用戶提供服務時,數(shù)據(jù)來源必須是準確的,不能發(fā)生“張冠李戴”“編造情節(jié)”“正確的廢話”和災難遺忘等問題。在可控層面,其一是內容安全,數(shù)據(jù)是有價值觀的,而大模型沒有,要重視訓練文本的合規(guī)問題;其二是關注企業(yè)自身數(shù)據(jù)安全和用戶隱私保護。在時效層面,災難性的遺忘一直都是大數(shù)據(jù)訓練的問題,即時數(shù)據(jù)的補充也是一項挑戰(zhàn)。在成本層面,千億模型私有化落地的時候需要訓練好,在企業(yè)端落地還需要讓企業(yè)用得起。并且,大模型對算力要求高,訓練成本居高不下。
問:公司擁有的網(wǎng)絡公開數(shù)據(jù)具有那些特點?規(guī)模有多大?
答:公司自2010年自建大數(shù)據(jù)中心,以長期服務多行業(yè)用戶持續(xù)積累的開源數(shù)據(jù)為基礎,擁有了規(guī)模及質量均位列業(yè)界前茅的公開信源數(shù)據(jù),目前數(shù)據(jù)總量超1500億條,并保持日均億級數(shù)據(jù)的采集增長。公司擁有的網(wǎng)絡公開數(shù)據(jù)具備信源權威可靠、內容價值觀對齊、豐富的專業(yè)領域知識、千億級數(shù)據(jù)規(guī)模、數(shù)據(jù)渠道和類型多樣性以及數(shù)據(jù)實時性(分鐘級更新)六大特點。所有公開采集的數(shù)據(jù)經(jīng)過加工處理后,將推送到公司三大數(shù)據(jù)資產(chǎn)平臺(媒體資訊、輿情、產(chǎn)業(yè)大腦),通過不同專業(yè)模型轉化成不同領域的知識數(shù)據(jù),實現(xiàn)數(shù)據(jù)從資源性到經(jīng)營性的數(shù)據(jù)資產(chǎn)變現(xiàn)。
問:公司專業(yè)大模型訓練具體分為哪些步驟?
答:公司拓天專業(yè)大模型訓練主要分為擴充數(shù)據(jù)基座、增量預訓練、指令微調、插件增強和測評五大步驟。
問:公司專業(yè)大模型在出版?zhèn)髅筋I域前景如何?
答:在傳媒出版領域,拓爾思長期服務人民出版社、人民教育出版社、知識產(chǎn)權出版社等23家出版單位,主要為傳媒出版用戶提供大數(shù)據(jù)資源管理、知識圖譜等技術服務。各家出版單位積累了各自細分賽道的優(yōu)質稀缺數(shù)據(jù)資源,但同時大多數(shù)出版單位不具備自己訓練垂類大模型的技術和資源,并且對將信息數(shù)據(jù)交由第三方MaaS服務商訓練而產(chǎn)生的數(shù)據(jù)泄露問題存在顧慮,擔心削弱其核心內容價值。公司在此過程中,可以成為出版業(yè)理想的合作伙伴,一是公司與上述出版單位已建立起長期友好的伙伴關系,具備信任基礎;二是公司承建的大數(shù)據(jù)資源管理、知識圖譜等平臺正是出版業(yè)運行優(yōu)質稀缺數(shù)據(jù)資產(chǎn)的主要系統(tǒng),公司熟悉出版業(yè)IT環(huán)境與數(shù)據(jù)特點;三是公司自主研發(fā)的拓天專業(yè)大模型,支持私有化部署和信創(chuàng),并對其進行了中文特性加強、內容安全、價值觀對齊等訓練;四是公司擁有的媒體資訊數(shù)據(jù)、產(chǎn)業(yè)數(shù)據(jù)、政策數(shù)據(jù)、風控數(shù)據(jù)等全域另類數(shù)據(jù)與出版業(yè)擁有的各自內容細分獨特領域數(shù)據(jù),可以按專業(yè)維度進行融合訓練,打造出不同專業(yè)領域的知識助手;五是雙方共同打造的垂類知識助手,以合作分成的方式進行聯(lián)合共創(chuàng)運營,可面向不同行業(yè)的從業(yè)人員、高校師生、研究機構、產(chǎn)業(yè)鏈企業(yè)等提供專業(yè)的付費知識服務。目前,公司正在和多家合作出版用戶積極推進聯(lián)合共創(chuàng)垂類知識大模型的事宜。
問:拓天大模型有哪些應用場景?
答:在不同大模型數(shù)據(jù)和功能的基礎上,公司自研拓天大模型通過提供對應的提示工程接口和模型精調接口等生成政務大模型、金融大模型和媒體大模型,應用場景包括政務應用、金融應用和媒體應用。政務應用涵蓋公文輔助寫作、政策解讀等;金融應用涵蓋投研報告自動生成、投研知識問答等;媒體應用涵蓋新聞資訊知識型搜索、以文生圖配稿等。
問:請問公司有沒有算力租賃相關業(yè)務?同英偉達有合作嗎?
答:目前,公司不涉及算力租賃相關業(yè)務。公司未來將進一步與行業(yè)合作伙伴、區(qū)域合作伙伴、服務合作伙伴、運營商以及行業(yè)知識專家、行業(yè)頭部企業(yè)展開市場、渠道、算力、智力、創(chuàng)新樣本等全方位的合作。公司同英偉達暫未開展直接商業(yè)合作;
調研參與機構詳情如下:
參與單位名稱 | 參與單位類別 | 參與人員姓名 |
---|---|---|
中信建投基金 | 基金公司 | 趙堅 |
中加基金 | 基金公司 | 黃曉磊 |
平安基金 | 基金公司 | 張淼 |
泰達宏利基金 | 基金公司 | 蘭飛、徐雨楠 |
中金公司 | 證券公司 | 童思藝 |
華安證券 | 證券公司 | 傅曉烺、王奇鈺 |
平安證券 | 證券公司 | 付強、王佳一 |
開源證券 | 證券公司 | 劉逍遙 |
鴻道投資 | 陽光私募機構 | 於彩 |
國壽養(yǎng)老 | 保險公司 | 徐寶龍、馬志強 |
美林證券 | 海外機構 | 莊亞林、李慧群 |
CBC寬帶資本 | 其他 | 陳曼榕 |
匯泉基金 | 其他 | 陳蘇 |
關鍵詞:
版權與免責聲明:
1 本網(wǎng)注明“來源:×××”(非商業(yè)周刊網(wǎng))的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責,本網(wǎng)不承擔此類稿件侵權行為的連帶責任。
2 在本網(wǎng)的新聞頁面或BBS上進行跟帖或發(fā)表言論者,文責自負。
3 相關信息并未經(jīng)過本網(wǎng)站證實,不對您構成任何投資建議,據(jù)此操作,風險自擔。
4 如涉及作品內容、版權等其它問題,請在30日內同本網(wǎng)聯(lián)系。