新聞中心
18
2023
-
04
大模型競爭升溫,AI芯片管制難以限制發(fā)展
知名研究機(jī)構(gòu)國際戰(zhàn)略研究所(IISS)日前發(fā)布報(bào)告,指出盡管美國限制高性能AI芯片對華出口,但這些控制措施可能會(huì)促使中國人工智能研究人員朝著“計(jì)算要求較低的領(lǐng)域”,并引導(dǎo)他們發(fā)展“新的競爭優(yōu)勢”。
來源:
知名研究機(jī)構(gòu)國際戰(zhàn)略研究所(IISS)日前發(fā)布報(bào)告,指出盡管美國限制高性能AI芯片對華出口,但這些控制措施可能會(huì)促使中國人工智能研究人員朝著“計(jì)算要求較低的領(lǐng)域”,并引導(dǎo)他們發(fā)展“新的競爭優(yōu)勢”。
報(bào)告稱,近年來,大型語言模型的能力有了顯著提升,OpenAI在2020年創(chuàng)建GPT-3是一個(gè)重要的里程碑。這些改進(jìn)歸因于更大、更通用的模型架構(gòu)的創(chuàng)建以及數(shù)據(jù)集大小的增加以及技術(shù)公司為增加訓(xùn)練模型的計(jì)算能力所花費(fèi)的金額。實(shí)證研究表明,給定模型的數(shù)據(jù)集大小、計(jì)算開銷和參數(shù)計(jì)數(shù)之間存在密切關(guān)系,并且在實(shí)踐中,計(jì)算開銷是模型改進(jìn)的最強(qiáng)約束。
此外,越來越多的參與者正在開發(fā)大型語言模型,并在多個(gè)維度上出現(xiàn)擴(kuò)散。如大型語言模型的研究主要發(fā)生在美國,但其他國家的研究人員——尤其是中國,以及其他地方的特定研究機(jī)構(gòu),如英國的 DeepMind——已經(jīng)投入了大量資源建立自己的模型。此外,開發(fā)語言模型的機(jī)構(gòu)類型已經(jīng)擴(kuò)展到既包括谷歌和微軟等大型科技公司,也包括分散的研究人員集體。
報(bào)告認(rèn)為,大模型技術(shù)的擴(kuò)散對安全有兩個(gè)近期影響:這些模型可能會(huì)為虛假信息生產(chǎn)更高質(zhì)量和更多的內(nèi)容,而對大模型開發(fā)的競爭可能會(huì)加劇地緣z治緊張局勢。
報(bào)告還分析了去年10月,美國政府宣布對流向中國的先進(jìn)半導(dǎo)體芯片實(shí)行新的出口管制,部分原因是這些芯片對人工智能發(fā)展至關(guān)重要。雖然出口管制的既定意圖是限制用于監(jiān)視或軍事應(yīng)用的人工智能系統(tǒng)的發(fā)展,但語言模型也高度依賴于這些先進(jìn)的半導(dǎo)體。實(shí)施出口管制的部分真實(shí)動(dòng)機(jī)可能是為了保持美國在語言模型方面的優(yōu)勢,無論是作為更廣泛的人工智能技術(shù)競爭戰(zhàn)略的一部分,還是因?yàn)檎貏e想抑制中國在語言模型方面的發(fā)展。
報(bào)告還懷疑這些措施是否有效。盡管由于計(jì)算能力的提高,大語言模型得到了改進(jìn),但它們不能以目前的速度繼續(xù)這樣做。研究人員正在積極尋求開發(fā)計(jì)算效率更高的方法來訓(xùn)練類似模型。一個(gè)國家試圖限制另一個(gè)國家的計(jì)算能力作為競爭人工智能發(fā)展的一種手段,可能會(huì)激勵(lì)目標(biāo)國家在這些計(jì)算效率更高的人工智能方法中發(fā)展競爭優(yōu)勢。
此外,高質(zhì)量文本如書籍和學(xué)術(shù)期刊文章可能很快成為語言模型發(fā)展的一個(gè)比計(jì)算能力可用性更緊迫的限制。
各國也可能越來越多地將大模型的開發(fā)視為一種民族自豪感,這種看法可能會(huì)加劇對其開發(fā)的競爭。報(bào)告擔(dān)心,隨著大模型越來越接近國家技術(shù)競爭的中心,政府可能會(huì)更積極地切斷本國居民對競爭國家開發(fā)的語言模型的訪問,從而進(jìn)一步分裂互聯(lián)網(wǎng)。
關(guān)鍵詞:
相關(guān)新聞
2023-05-24
2023-05-12
2023-05-06
2023-04-26
2023-04-18