首頁 > 互聯網 > 正文

    【全球熱聞】深化交流合作 筑牢AI安全屏障

    2023-06-25 10:41:09來源:人民郵電報  

    ChatGPT寫文章調代碼,文心一言巧解雞兔同籠數學題,Microsoft 365Copilot幫“打工人”做PPT,Midjourney V5繪制的20世紀90年代中國情侶刷屏朋友圈……人工智能領域的大事一件接著一件,令人欣喜,也引人擔憂。擔心被AI“搶飯碗”,擔心AI發展過快超出人類管控的能力范圍。

    最近,包括“ChatGPT之父”、OpenAI創始人兼CEO山姆·阿爾特曼,谷歌DeepMind公司CEO戴密斯·哈薩比斯以及美國Anthropic公司的CEO達里奧·阿莫代伊在內的一眾AI界大佬聯名簽署了一封公開信,信的內容很短,加上the和a在內僅有22個單詞。字數少,但信息量很大。信中這樣說:“與流行病和核戰爭等其他社會規模的風險一樣,緩解人工智能導致的滅絕風險應該被視作全球的優先事項。”信中把AI提到了與流行病和核戰爭同樣的級別,足以見得AI野蠻生長帶來的問題的嚴重性。比如AI系統設計不當或被惡意使用,可能會讓歧視和偏見不斷固化、虛假信息蔓延、隱私數據泄露……呼吁全球通力合作,對人工智能進行規范與監管,共同去應對、去解決AI超速發展帶來的挑戰。


    (資料圖片)

    上一封著名的AI公開信是在3月底,距離GPT-4發布僅兩周時間。包括特斯拉CEO埃隆·馬斯克在內的1000多名企業高管、學界專家聯署發表公開信,呼吁所有AI實驗室立即暫停訓練比GPT-4更強大的AI系統,暫停至少6個月。

    為什么全球頂尖AI公司的高管和學界大咖要呼吁限制AI發展,他們在擔心些什么?或許是AI快速發展在帶給人們驚喜的同時也帶來了未知,有些問題甚至連開發者本身都無能為力。

    近日,在2023北京智源大會上,阿爾特曼呼吁全球各方就AI安全問題通力合作,建立國際通行的AI安全標準,并推進人工智能對齊(AI alignment,即引導AI系統的表現,使其符合設計者的預期目標)研究。他提出,可以嘗試使用AI系統輔助人類來監督其他AI系統。以未來的AGI(通用人工智能)系統為例,可能包含10萬行的二進制代碼,人類有必要借助AI來輔助監督,判別系統是否存在違規行為。除了必要性之外,這種方法的好處在于,伴隨AI技術的突破,AI監管技術也在同步發展。

    在與智源研究院理事長張宏江圍繞“AI安全與對齊”議題的問答討論中,阿爾特曼談到,未來十年內,全球很可能擁有一個非常強大的AI系統,屆時人類會面臨很多安全問題,因此,要從現在開始做好準備。他強調,對于AI安全而言,建立統一公平的框架和測試標準,讓每個達到一定能力的AI模型都接受測試具有重要意義。他表示,解決AI對齊問題難度極大,需要來自世界各地最好的頭腦,并稱中國有很多優秀的人工智能人才,期待中國AI研究者能為AI安全提供中國智慧。

    請掃碼觀看視頻

    劃重點!關于AI對齊

    什么是AI對齊?

    AI對齊(AI alignment)是AI控制問題中的一個主要問題,即要求AI系統的目標要和人類的價值觀與利益保持一致。

    實現AI對齊面臨哪些挑戰?

    ◆ 選擇合適的價值觀

    ◆ 將價值觀編碼到AI系統中,使系統表現與價值觀一致

    ◆ 選擇合適的訓練數據

    AI對齊的研究方法

    DeepMind和OpenAI圍繞AI對齊分別從“提出合適的價值觀”和“用技術方法實現對齊”兩方面進行研究。

    在用技術方法實現對齊方面,DeepMind提出了一種基于“逆強化學習(Inverse Reinforcement Learning)”的方法,該方法關注人類的行為,能夠從行為表現中推斷出價值觀,并將其編碼到AI系統中。OpenAI則提出了一種基于“對抗訓練(Adversarial Training)”的方法,通常用于增強模型的魯棒性和泛化能力,該方法可以讓AI系統在與人進行交互時學習到人類的價值觀。

    逆強化學習的關注點在于人類的行為,從行為表現推斷價值觀;而對抗訓練的重點是交互,從AI系統與人的交互中學習價值觀。

    標簽:

    相關閱讀

    相關詞

    推薦閱讀

    校园亚洲春色另类小说合集| 亚洲狠狠婷婷综合久久久久| 亚洲精品又粗又大又爽A片| 亚洲最大av无码网址| 亚洲一区二区三区久久| 2022中文字字幕久亚洲| 爱情岛亚洲论坛在线观看 | 亚洲热妇无码AV在线播放| 日本亚洲国产一区二区三区| 亚洲小说图区综合在线| 亚洲成色在线影院| 亚洲精品无码AV中文字幕电影网站| 亚洲一区动漫卡通在线播放| 亚洲人成片在线观看| 亚洲an天堂an在线观看| 亚洲区小说区图片区| 久久久久久亚洲精品不卡| 亚洲av色香蕉一区二区三区| 亚洲免费福利视频| 亚洲日韩国产精品乱-久| 337p欧洲亚洲大胆艺术| 国内精品久久久久久久亚洲 | 亚洲视频网站在线观看| 亚洲一本之道高清乱码| 久久久久亚洲国产| 精品国产亚洲第一区二区三区| 校园亚洲春色另类小说合集| 亚洲男人的天堂一区二区| 亚洲午夜福利在线观看| 亚洲片国产一区一级在线观看 | 亚洲同性男gay网站在线观看| 亚洲一区精彩视频| 国产精品亚洲av色欲三区| 亚洲国产婷婷综合在线精品| 亚洲综合无码精品一区二区三区| 久久久久久久综合日本亚洲| 久久精品夜色噜噜亚洲A∨| 国产亚洲综合色就色| 亚洲精品中文字幕无码AV| 久久精品国产亚洲av水果派| 亚洲国产精彩中文乱码AV|