第386章 遠超海內外的大模型

投票推薦 加入書籤 小說報錯

  第386章 遠超海內外的大模型

  「是有新的工作任務嗎徐院?」

  邱軒走至徐銘身旁,很是虛心的詢問,以為自己哪裡做的不到位。

  正專注於量子指揮雲平台的徐銘,聽到耳旁傳來熟悉聲音,他暫時停下手上動作,微微扭頭抬起目光向邱軒看過去。

  頓時臉上浮現出笑容,直接回應對方。

  「沒有。」

  「你們的工作,完成的很好,廣寒月球模型已經全面升級。」

  「後續等著計算機終端布置到月球就行。」

  說這番話時,還不忘誇讚了兩句,對這段時間廣寒模型的升級比較滿意。

  把徐銘的話一字不漏聽進耳中,看到徐院士如此認可後,心裡高興之下不由得撓了撓頭,毫不掩飾堆出的靦腆笑容。

  「多虧有徐院您的指導。」

  然話音落下後,他並未直接轉身離開。

  反倒再次表示道:「有需要我幫忙的地方,徐院您儘管開口,剛好接下來半個月都很輕鬆。」

  他這話一點沒說錯。

  按照探月與航天工程中心的規劃,月底將會再次發射攬月著陸器,運送高性能計算機終端,好通過中繼衛星與地球量子計算機大腦建立聯繫。

  其中還包括搬運和裝配月球機器人。

  由於全面升級後的廣寒模型,和量子模塊,都已集成到月球終端上。

  所以在正式發射前的這段時間,相對比較空閒。

  眼下看到,徐院士有新的工作內容,那肯定要積極參與進去。

  畢竟這可是最佳的,學習和成長機會。

  加上還和量子計算機有關係。

  哪怕放眼全世界,都碰不到第二個。

  而有類似想法的,還不單單他自己,幾乎是話音才剛落下的瞬間,身後另外幾位研究員也當即附和。

  「是啊徐院,我們也想多找點事干。」

  「有事情直接交代我們就行。」

  「我也一樣。」

  徐銘迎上面前幾人的堅定目光,頓時樂了起來。

  沒想到邱軒他們,對工作同樣如此積極。

  考慮到對方在廣寒模型升級上的表現,他在略作思索後還是說明了情況。

  「事情是這樣的。」

  「我打算用量子計算機,訓練一個類似GPT的國產大模型。」

  「智能大模型?」邱軒剛一聽到,臉上的表情頓時充滿了興趣。

  連帶其他幾個人,都同樣如此。

  顯然對這方面的新聞,平時有過詳細了解。

  最終稍頓了兩秒,只聽邱軒率先開口,主動講出自己的一些看法。

  「這兩年無論國內還是海外,確實都在花大的精力和經費訓練模型,OpenAI最新發布的版本,似乎參數達到了十萬億級別。

  7

  「在推理和代碼生成,多模態理解上刷新記錄。」

  「國內的產品,雖奮力追趕,但仍有差距。」

  「特別是在經典計算機的訓練成本,和數據質量以及工程能力上。」

  「不過我們擁有通用量子計算機,確實能快速訓練出一個模型來。」

  前腳把話說完,緊隨其後便有人補充。

  「神經網絡的矩陣運算,正是量子並行性的天然應用場景,祖沖之三號的邏輯比特數量,能輕鬆支撐萬億參數級模型的訓練。」

  「甚至以超導量子計算機的水平,最多幾天就能完成模型訓練。」

  瞧見邱軒他們,對這個話題討論的津津有味,他心裡忍不住暗笑。

  看樣子訓練國產智能模型,十有八九早就他們心裡產生了想法,只是礙於月球科研站項目,沒法去分心研究項目之外的事。

  如今有這樣一個機會,肯定不會錯過。

  念頭停留在這裡,徐銘心思頓時活躍起來,隨即點點頭選擇答應。

  「那好吧。」

  「你們這幾天就跟我打下手,爭取儘快完成這個模型的訓練。」

  話音剛落。

  便聽邱軒率先回道:「好的徐院。」

  眼神中滿是期待之色。

  除他之外其餘幾人,急忙開口的同時,想到馬上國內就要出現,由量子計算機訓練的智能大模型,心臟都不爭氣的加快跳動了幾分。

  深吸一口氣,才把感慨控制在兩句話。

  「這將會是全球,首個基於量子架構的模型,肯定能引起全世界的轟動。」

  「國產智能模型的水平,也會徹底領先海外。」

  但徐銘聽到後,卻搖了搖頭道:「訓練一個領先的多模態大模型沒問題,不過還是要稍微限制下,不能讓其太超模暴露出量子算力。」

  「把它當做我們對量子算力應用的實驗。」

  說完。

  連同邱軒在內的幾人,立刻點頭保證,明白徐銘話里的意思。

  「我們知道了徐院。」

  就這樣。

  接下來的時間,徐銘也不再單打獨鬥,給邱軒等人稍微分配了下工作。

  然後才繼續動手操作指令。

  在量子指揮雲平台,對祖沖之三號的量子算力協調使用下,屏幕上跳動著訓練損失函數的曲線,它優雅地收斂沒有震盪,更沒有過擬合,每一步都精準得像是被計算好的。

  隨著時間一分一秒流逝,徐銘也注意到,眼前面板上浮現出新的提示信息。

  【經過努力學習,你的[信息]水平提升了,獲得經驗值1點。】

  【經過————】

  五天後。

  2月12日,周三。

  元宵節。

  晚上七點左右,航天城探月與航天工程中心。

  徐銘仍舊沒有下班。

  經過量子計算機這幾天的訓練,他們的智元」大模型已進入基準測試階段。

  眼下正處於最重要時刻,肯定要和大家在一起。

  至於智元」這個名字,是他們商討後取得。

  「邱軒怎麼樣了?」

  隨著徐銘主動向邱軒詢問一句,後者臉上表情掛滿激動和興奮,顧不上起身立刻脫口匯報。

  「徐院。」

  「智元的MMLU和HumanEvaI,以及GSM8K等多個基準測試,全面超越當前市面上的大模型,同等硬體條件下生成速度快了近一倍。」

  絲毫沒有掩飾語氣中的驚喜。

  甚至不單單是他,旁邊其他人聽完這組數據,同樣倒吸了一口涼氣。

  雖然知道量子計算機的強大,但面對這種實際的應用結果,實在是難以讓心情保持平靜和鎮定。

  市面上的那些用戶量高的大模型,無不訓練了非常長的時間,投入巨大的研發成本資源和精力,然智元從決定開始動手,到今天滿打滿算還不到五天時間。

  關鍵推理分析效率,卻遙遙領先。

  更重要的是,這還是徐銘在訓練中,特意對參數進行限制,採用降級處理方式,避免模型太超模的結果。

  思維快速運轉下,徐銘嘴角微微上揚,然後抬起胳膊帶頭鼓掌。

  「不錯。」

  「這幾天大家辛苦了。」

  很快氛圍變得輕鬆熱鬧起來。

  其他人面對這樣的大模型,也連連附和感嘆。

  「我敢保證,如果智元上架市場,肯定會引起全民的狂熱。」

  「OpenAI那邊絕對想不到,他們的產品會這麼快就被市場淘汰,成為非常落後的大模型。」

  「你那純屬是廢話,智元可是全球,唯一份的全新量子架構模式,那些經典計算機架構的模型,根本沒有和智元比較的資格。」

  「恐怕這對於不少行業來說,也會帶去衝擊。」

  邱軒想到了什麼,接過其他人的話,最後略顯複雜的低喃一句。

  他這幾天,配合徐銘訓練智元模型,太清楚它的恐怖實力,哪怕對參數進行了限制,上市後照樣會對其它大模型以及一些行業,帶來不小的衝擊和變革。

  而徐銘聽到邱軒的話,則抬手輕拍了下對方的肩膀笑著開導一句。

  「科技的發展,是不會停下腳步的。」

  「至於在這個過程中,所帶來的一系列問題,我相信同樣能夠被科技解決。」

  從全新的半導體生態環境建立,到納米反應器大幅度降低癌症患者數量,科技向前發展的同時,勢必會對另一部分群體帶來或多或少影響。

  這是無法避免的。

  但總不能因為這個顧慮,便把已經攻克的先進技術隱藏起來。

  不過在徐銘看來,這些都不是問題。

  隨著常溫超導材料的問世,通用量子計算機祖沖之三號的應用,解決人類面臨的終極能源目標,實現可控核聚變只是時間問題。

  當人類文明發展的最重要能源發生變革,相信整個文明也會進入全新的時代。

  邱軒抬起目光,迎上徐銘的視線,再全部聽完後重重的點了下頭。

  「嗯。

  「6

  雖僅應上一聲,卻是對徐銘話語的信任。

  然緊接著,他又想到了什麼,於是再次開口又向徐銘詢問上一句。

  「對了徐院,我們怎麼讓智元上架?」

  「就以科學院的名義,註冊一個公司,把它偽裝成普通產品投放吧。」徐銘聞言想了想給出回答。

  這是他深入考慮過的。

  首先若以他的名義發布上市,必然一開始就會成為全世界關注的目標,有可能影響到月底,攬月著陸器的發射和月球直播活動。

  所以站在背後,讓科學院方面代為運行,是最為合適的辦法。

  很多商業公司也都是採用類似的辦法。

  另外儘快讓智元上線,能實際測試一些未發現的問題之外,更能幫助模型不斷疊代升級。

  邱軒僅是隨口一問,對於徐銘的意見,自然不會有任何的異議。

  也就在大家還沉浸在,智元帶來的成就,以及喜悅之中時,只見一道熟悉的身影從外面邁步走進來。

  手裡還提著一個多層食盒。

  徐銘很快注意到對方,連忙起身迎上去,邊接過其手裡的東西邊關心詢問。

  「你怎麼過來了,令儀在家乖不乖?」

  「爸媽今天專門做的湯圓,也不知道你什麼時候才能回去,怕放坨不好吃就讓我給你帶來了。」陳璐邊柔聲回答邊打開放到桌上的食盒說:「令儀這會兒自己在房間寫作業呢。」

  望向陳璐手中的湯圓,徐銘眼含愛意,接著又朝距他十幾步遠的邱軒幾人看過去。

  「算你們有口福,都嘗嘗吧。」

  聞言陳璐也很配合的,拿起另外一份,主動招呼其他人。

  「知道你們估計都還沒吃,我特意多帶了一些。」

  這段時間裡,陳璐來的次數並不少,有時候還會帶上女兒一起,所以邱軒等人對她自然不會陌生。

  既然話都說到這裡,肯定不會再靦腆,當即大大方方走了過去。

  「謝謝陳主任。」

  他們並不算是徐銘的學生,因此稱呼陳璐,選擇了對方的職位身份。

  這也是陳璐第一回過來時就用的。

  是的。

  如今陳璐在智庫宏觀經濟管理部門,已升任了辦公室主任。

  徐銘坐下後,用勺子舀起一個湯圓,放進嘴裡吃完咽下,不忘主動和身旁的陳璐搭話。

  「這邊的工作已經忙完了,等下我們一起回去。」

  「好。」

  對此陳璐只是點了頭,輕聲吐出一個字,安靜坐在旁邊滿眼直勾勾看著徐銘。

  思緒也不由得,重新回到了高三下學期。

  那時的她,便是像現在這樣,經常偷瞄注視徐銘專注學習的模樣。

  不多時。

  待吃完全部的湯圓,徐銘便也不再耽擱,同邱軒他們交代了幾句,便和陳璐一起回家0

  另外值得一提的是,關於智元多模態大模型,要在市場上架的事,徐銘路上也聯繫了余高遠,向對方講明大致的訴求和標準。

  作為科學院現任院長的余高遠,得知徐銘在應用量子計算機,加快月球科研站項目進展之外,還順手訓練出一個遠超海內外的大模型。

  心裏面也是非常高興。

  他自然也知道,當前大模型熱度,以及未來前景。

  國內公司雖出了不少產品,卻仍在對海外產品的效率進行追趕,目前依舊存在著一定的差距。

  現在徐銘這邊搞出一個國家隊產品,無疑屬於是雪中送炭。

  為此他直接在電話里表態,會用最快的時間成立智元科技公司,並讓智元上市到海內外市場。

  另外按照徐銘要求,隱藏公司實際信息同時,給予絕大部分的股權。

  可以說等智元模型占領市場,將獲得的利益將會非常可觀。

  不過對徐銘來講,金錢的多少早沒意義,對於這件事倒也沒有太多關注。

  而回到家之後,他則把注意力放到面板上,查看順利提升到5級的信息學科和詞條。

  >

章節目錄