圓桌｜生成式AI時代，大模型資料安全如何保障？-今日必看

圓桌｜生成式AI時代，大模型資料安全如何保障？

來源：NG影片釋出時間：2024-04-28 06:33

在生成式AI（人工智慧）時代，資料安全的出路可能會是“用魔法打敗魔法”，智慧財產權保護也可能要提前到token（字串）層面。

4月26日，在2024中關村論壇上，人工智慧企業與學者就AI大模型的資料安全問題進行了討論。

中關村論壇資料安全治理與發展論壇現場澎湃新聞記者秦盛攝

“在生成式人工智慧時代，我們在資料安全層面，面臨的是不斷組合和創造新的資料安全風險的問題，徹底解決這種風險需要演算法和工具的支撐，而不是靠人，或者靠靜態的方法去做相對固定的檢測。”清華大學計算機科學與技術系教授、人工智慧研究院基礎模型研究中心副主任黃民烈如是說道。

他認為，生成式人工智慧可以透過訓練去組合，去生成新的內容，這些內容可能在過去的語料里根本沒出現過，但它依然是有害的。所以，即便把訓練資料處理得很乾淨，在生成式人工智慧時代依然會面臨有害內容產生的情況。

要解決這些問題，需要進行演算法研究，比如針對性對抗攻擊、自動紅隊，然後再加上安全和對齊手段，能夠把問題線上下時就自動進行修復。

奇安信集團副總裁劉前偉表示：“做行業大模型的廠商都很擔心語料會不會被竊取、有沒有漏洞導致這些很核心的資料資產會洩露。這是通用大模型裡過去沒有特別關注的一點。”

劉前偉指出，在進行微調時，防篡改要求非常高，更需要安全，一旦標註錯誤，就會導致安全大模型判斷錯誤。

而對於通用模型的使用，幾乎所有人都會面臨一個問題，就是當我們去問大模型問題時，會不會造成商業機密、個人資訊的洩露。“不管是使用者還是開發者，都要解決隱私安全、商業機密、甚至是國家安全的問題。現在只能用AI對抗AI的方式才能解決內容安全的問題，用過去傳統的流量過濾的方式是無法解決的，所以‘用魔法打敗魔法’可能是一個很大的出路。”劉前偉表示。

IBM資料與轉型諮詢主管合夥人張玉明表示，IBM Global的一份調查報告調研了全球100多個國家和地區的高管對人工智慧的看法，94%的企業高管都認為在部署AI解決方案前要確保模型的安全，但只有24%的企業打算在未來6個月內去引入一些網路安全元件，這就說明大家的認知和實際行動之間還存在延遲。

劉前偉指出，當下面臨的另一個挑戰，是跨境資料流動問題。如果全球的資料都匯聚在一起，不管是行業還是通用模型，訓練效果一定會有很大改善。但是，資料跨境面臨很多挑戰，需要在多邊協議等方面做更多的事，更多去擁抱國際組織，讓國際的資料能夠雙向流通。

香港科技大學助理教授、香港生成式人工智慧研發中心資深商業拓展經理韓斯睿認為，現有的智慧財產權保護制度，其實在智力產品的生成物層面就已截斷，在生成式人工智慧訓練的token級別如何確權、如何保護，並沒有共識。所以在資料脫離原本形態進入token新形態時如何進行確權保護，是法律和政策方面的一個癥結，如果這個癥結打通了，相信會極大地促進知識共享和流通發展。

澎湃新聞記者秦盛

(本文來自澎湃新聞，更多原創資訊請下載“澎湃新聞”APP)

在生成式AI（人工智慧）時代，資料安全的出路可能會是“用魔法打敗魔法”，智慧財產權保護也可能要提前到token（字串）層面。

4月26日，在2024中關村論壇上，人工智慧企業與學者就AI大模型的資料安全問題進行了討論。

中關村論壇資料安全治理與發展論壇現場澎湃新聞記者秦盛攝

要解決這些問題，需要進行演算法研究，比如針對性對抗攻擊、自動紅隊，然後再加上安全和對齊手段，能夠把問題線上下時就自動進行修復。

劉前偉指出，在進行微調時，防篡改要求非常高，更需要安全，一旦標註錯誤，就會導致安全大模型判斷錯誤。

澎湃新聞記者秦盛

(本文來自澎湃新聞，更多原創資訊請下載“澎湃新聞”APP)

在生成式AI（人工智慧）時代，資料安全的出路可能會是“用魔法打敗魔法”，智慧財產權保護也可能要提前到token（字串）層面。

4月26日，在2024中關村論壇上，人工智慧企業與學者就AI大模型的資料安全問題進行了討論。

中關村論壇資料安全治理與發展論壇現場澎湃新聞記者秦盛攝