AI大模型“狂”潮還將持續(xù)多久?訪北京郵電大學(xué)教授曾劍秋

    2023-08-03 09:51:02來源:人民郵電報(bào)  


    【資料圖】

    科技創(chuàng)新總是在發(fā)現(xiàn)問題、解決問題中前行,每一項(xiàng)顛覆性創(chuàng)新成果從來都不是水到渠成的自然發(fā)展,而是由量的積累帶來質(zhì)的提升。對(duì)于人工智能大模型而言,參數(shù)規(guī)模的倍增帶來了智能涌現(xiàn)。當(dāng)下,大模型密集發(fā)布,各大廠商紛紛加碼人工智能,這樣的大模型“狂”潮還會(huì)持續(xù)多久,發(fā)展方向是什么?針對(duì)業(yè)界關(guān)注的熱點(diǎn)問題,《人民郵電》報(bào)記者采訪了北京郵電大學(xué)教授曾劍秋。

    AI大模型兼具“大規(guī)模”和“預(yù)訓(xùn)練”兩種屬性,在海量數(shù)據(jù)上進(jìn)行訓(xùn)練后能夠完成一系列下游任務(wù)。曾劍秋認(rèn)為,大模型帶來的顛覆性創(chuàng)新可以總結(jié)為:規(guī)模大、速度快、場(chǎng)景全。首先,參數(shù)規(guī)模上,從GPT-1的1.17億參數(shù)到GPT-3的1750億參數(shù),大模型的參數(shù)規(guī)模動(dòng)輒上千億,能夠從海量數(shù)據(jù)和知識(shí)中學(xué)習(xí),在不同領(lǐng)域和場(chǎng)景中“輕松”完成任務(wù)。其次,得益于信息基礎(chǔ)設(shè)施穩(wěn)步推進(jìn)帶來的算力提升,大模型能夠在短時(shí)間內(nèi)響應(yīng)用戶并提供歸納整理后的內(nèi)容,已然從聊天機(jī)器人轉(zhuǎn)變?yōu)閿?shù)字助手。最后,在應(yīng)用廣度方面,大模型似乎是“全才”,寫詩、編程、繪畫、解題樣樣全能,具有廣闊的應(yīng)用場(chǎng)景。

    曾劍秋認(rèn)為,大模型是建立在網(wǎng)絡(luò)能力、數(shù)據(jù)能力和計(jì)算能力三者之上的創(chuàng)新應(yīng)用。大模型需要在多個(gè)設(shè)備之間進(jìn)行數(shù)據(jù)傳輸和參數(shù)同步,而堅(jiān)實(shí)的網(wǎng)絡(luò)基礎(chǔ)為大模型提供了高效、穩(wěn)定、可擴(kuò)展的訓(xùn)練和部署環(huán)境。數(shù)據(jù)要素作為數(shù)字經(jīng)濟(jì)的核心生產(chǎn)要素,已成為推動(dòng)產(chǎn)業(yè)升級(jí)、優(yōu)化經(jīng)濟(jì)結(jié)構(gòu)和打造經(jīng)濟(jì)增長(zhǎng)點(diǎn)的戰(zhàn)略性資源。數(shù)據(jù)能力對(duì)于大模型的訓(xùn)練和應(yīng)用至關(guān)重要,因?yàn)榇竽P托枰獜暮A繑?shù)據(jù)中學(xué)習(xí)和捕獲知識(shí)以提升泛化能力。在計(jì)算能力方面,大模型需要海量的計(jì)算資源來執(zhí)行復(fù)雜運(yùn)算和存儲(chǔ)巨量參數(shù),需要使用高性能、低功耗、高度并行的計(jì)算設(shè)備和系統(tǒng)(如GPU),可以說,算力是大模型訓(xùn)練、人工智能發(fā)展的基礎(chǔ)設(shè)施。曾劍秋談到,這三種能力是大模型發(fā)展、人工智能產(chǎn)業(yè)進(jìn)步、信息技術(shù)創(chuàng)新應(yīng)用的“沃土”。

    入局大模型的門檻主要包括基礎(chǔ)門檻、訓(xùn)練門檻和應(yīng)用門檻。曾劍秋談到,基礎(chǔ)門檻包括網(wǎng)絡(luò)能力和數(shù)據(jù)處理能力,需要具備大模型訓(xùn)練計(jì)算所需的高性能服務(wù)器、GPU設(shè)備、高速網(wǎng)絡(luò)等。訓(xùn)練門檻是指大模型的“成長(zhǎng)”迭代需要不斷訓(xùn)練,需要提供符合一定標(biāo)準(zhǔn)的高質(zhì)量訓(xùn)練數(shù)據(jù),因而需要花費(fèi)時(shí)間和計(jì)算資源來對(duì)數(shù)據(jù)進(jìn)行清洗和預(yù)處理,從而保障數(shù)據(jù)的質(zhì)量和準(zhǔn)確性。應(yīng)用門檻是指大模型的落地需要與垂直行業(yè)需求深度融合,同時(shí),對(duì)于企業(yè)來說需要權(quán)衡收益與研發(fā)成本。

    基于公有數(shù)據(jù)的大模型是通用底座,很難滿足專業(yè)場(chǎng)景的特定需求。曾劍秋談到,如何打通大模型技術(shù)和產(chǎn)業(yè)應(yīng)用的“最后一公里”,找到計(jì)算資源和產(chǎn)業(yè)應(yīng)用效果之間的平衡,是需要關(guān)注的重點(diǎn)課題。

    大模型“熱”需要“冷”思考,要超前布局也要理性發(fā)展。曾劍秋表示,盲目跟風(fēng)研發(fā)大模型不可取,當(dāng)熱潮退去,留下的注定是推動(dòng)人工智能技術(shù)革新、深耕垂直行業(yè)應(yīng)用的數(shù)智實(shí)干家。同時(shí),曾劍秋建議建立國(guó)家級(jí)的基礎(chǔ)大模型平臺(tái),加強(qiáng)智算中心、超算中心等算力資源統(tǒng)籌,加強(qiáng)跨數(shù)據(jù)中心算力協(xié)同能力,從戰(zhàn)略高度著手,培育大模型發(fā)展基礎(chǔ),構(gòu)筑人工智能發(fā)展優(yōu)勢(shì)。

    標(biāo)簽:

    相關(guān)閱讀

    相關(guān)詞

    推薦閱讀

    亚洲精品无码专区久久久| 久久久久亚洲av无码专区蜜芽| 亚洲卡一卡2卡三卡4卡无卡三| 亚洲国产精品久久网午夜| 狠狠入ady亚洲精品| 亚洲熟妇无码一区二区三区 | 久久精品亚洲中文字幕无码麻豆| 亚洲精品国产福利一二区| 亚洲乱码国产乱码精华| 亚洲精品中文字幕| 久久精品国产亚洲αv忘忧草| 亚洲噜噜噜噜噜影院在线播放| 亚洲精彩视频在线观看| 久久亚洲精品无码AV红樱桃| 亚洲综合日韩中文字幕v在线| 精品亚洲成a人片在线观看| 久久久亚洲欧洲日产国码是AV| 亚洲国产成人私人影院| 亚洲黄色在线观看| 亚洲免费在线视频观看| 亚洲人成人网毛片在线播放| 亚洲一久久久久久久久| 亚洲精品亚洲人成在线| 亚洲av无一区二区三区| 亚洲av中文无码乱人伦在线观看| 日韩精品亚洲专区在线影视| 亚洲国产天堂久久久久久| 久久精品亚洲乱码伦伦中文| 中文国产成人精品久久亚洲精品AⅤ无码精品| 亚洲国产香蕉人人爽成AV片久久| 亚洲日韩中文在线精品第一| 亚洲综合无码精品一区二区三区| 国产精品亚洲精品日韩已满| 亚洲另类激情综合偷自拍| 亚洲人成网站在线观看播放动漫 | 亚洲伊人色欲综合网| 亚洲AV综合色区无码一区| 97亚洲熟妇自偷自拍另类图片| 亚洲字幕在线观看| 亚洲AV一二三区成人影片| 亚洲精品女同中文字幕|