圓桌|生成式AI時代,大模型資料安全如何保障?

首頁 > 科技

圓桌|生成式AI時代,大模型資料安全如何保障?

來源:NG影片 釋出時間:2024-04-28 06:33

在生成式AI(人工智慧)時代,資料安全的出路可能會是“用魔法打敗魔法”,智慧財產權保護也可能要提前到token(字串)層面。

4月26日,在2024中關村論壇上,人工智慧企業與學者就AI大模型的資料安全問題進行了討論。

中關村論壇資料安全治理與發展論壇現場 澎湃新聞記者 秦盛 攝

“在生成式人工智慧時代,我們在資料安全層面,面臨的是不斷組合和創造新的資料安全風險的問題,徹底解決這種風險需要演算法和工具的支撐,而不是靠人,或者靠靜態的方法去做相對固定的檢測。”清華大學計算機科學與技術系教授、人工智慧研究院基礎模型研究中心副主任黃民烈如是說道。

他認為,生成式人工智慧可以透過訓練去組合,去生成新的內容,這些內容可能在過去的語料里根本沒出現過,但它依然是有害的。所以,即便把訓練資料處理得很乾淨,在生成式人工智慧時代依然會面臨有害內容產生的情況。

要解決這些問題,需要進行演算法研究,比如針對性對抗攻擊、自動紅隊,然後再加上安全和對齊手段,能夠把問題線上下時就自動進行修復。

奇安信集團副總裁劉前偉表示:“做行業大模型的廠商都很擔心語料會不會被竊取、有沒有漏洞導致這些很核心的資料資產會洩露。這是通用大模型裡過去沒有特別關注的一點。”

劉前偉指出,在進行微調時,防篡改要求非常高,更需要安全,一旦標註錯誤,就會導致安全大模型判斷錯誤。

而對於通用模型的使用,幾乎所有人都會面臨一個問題,就是當我們去問大模型問題時,會不會造成商業機密、個人資訊的洩露。“不管是使用者還是開發者,都要解決隱私安全、商業機密、甚至是國家安全的問題。現在只能用AI對抗AI的方式才能解決內容安全的問題,用過去傳統的流量過濾的方式是無法解決的,所以‘用魔法打敗魔法’可能是一個很大的出路。”劉前偉表示。

IBM資料與轉型諮詢主管合夥人張玉明表示,IBM Global的一份調查報告調研了全球100多個國家和地區的高管對人工智慧的看法,94%的企業高管都認為在部署AI解決方案前要確保模型的安全,但只有24%的企業打算在未來6個月內去引入一些網路安全元件,這就說明大家的認知和實際行動之間還存在延遲。

劉前偉指出,當下面臨的另一個挑戰,是跨境資料流動問題。如果全球的資料都匯聚在一起,不管是行業還是通用模型,訓練效果一定會有很大改善。但是,資料跨境面臨很多挑戰,需要在多邊協議等方面做更多的事,更多去擁抱國際組織,讓國際的資料能夠雙向流通。

香港科技大學助理教授、香港生成式人工智慧研發中心資深商業拓展經理韓斯睿認為,現有的智慧財產權保護制度,其實在智力產品的生成物層面就已截斷,在生成式人工智慧訓練的token級別如何確權、如何保護,並沒有共識。所以在資料脫離原本形態進入token新形態時如何進行確權保護,是法律和政策方面的一個癥結,如果這個癥結打通了,相信會極大地促進知識共享和流通發展。

澎湃新聞記者 秦盛

(本文來自澎湃新聞,更多原創資訊請下載“澎湃新聞”APP)

在生成式AI(人工智慧)時代,資料安全的出路可能會是“用魔法打敗魔法”,智慧財產權保護也可能要提前到token(字串)層面。

4月26日,在2024中關村論壇上,人工智慧企業與學者就AI大模型的資料安全問題進行了討論。

中關村論壇資料安全治理與發展論壇現場 澎湃新聞記者 秦盛 攝

“在生成式人工智慧時代,我們在資料安全層面,面臨的是不斷組合和創造新的資料安全風險的問題,徹底解決這種風險需要演算法和工具的支撐,而不是靠人,或者靠靜態的方法去做相對固定的檢測。”清華大學計算機科學與技術系教授、人工智慧研究院基礎模型研究中心副主任黃民烈如是說道。

他認為,生成式人工智慧可以透過訓練去組合,去生成新的內容,這些內容可能在過去的語料里根本沒出現過,但它依然是有害的。所以,即便把訓練資料處理得很乾淨,在生成式人工智慧時代依然會面臨有害內容產生的情況。

要解決這些問題,需要進行演算法研究,比如針對性對抗攻擊、自動紅隊,然後再加上安全和對齊手段,能夠把問題線上下時就自動進行修復。

奇安信集團副總裁劉前偉表示:“做行業大模型的廠商都很擔心語料會不會被竊取、有沒有漏洞導致這些很核心的資料資產會洩露。這是通用大模型裡過去沒有特別關注的一點。”

劉前偉指出,在進行微調時,防篡改要求非常高,更需要安全,一旦標註錯誤,就會導致安全大模型判斷錯誤。

而對於通用模型的使用,幾乎所有人都會面臨一個問題,就是當我們去問大模型問題時,會不會造成商業機密、個人資訊的洩露。“不管是使用者還是開發者,都要解決隱私安全、商業機密、甚至是國家安全的問題。現在只能用AI對抗AI的方式才能解決內容安全的問題,用過去傳統的流量過濾的方式是無法解決的,所以‘用魔法打敗魔法’可能是一個很大的出路。”劉前偉表示。

IBM資料與轉型諮詢主管合夥人張玉明表示,IBM Global的一份調查報告調研了全球100多個國家和地區的高管對人工智慧的看法,94%的企業高管都認為在部署AI解決方案前要確保模型的安全,但只有24%的企業打算在未來6個月內去引入一些網路安全元件,這就說明大家的認知和實際行動之間還存在延遲。

劉前偉指出,當下面臨的另一個挑戰,是跨境資料流動問題。如果全球的資料都匯聚在一起,不管是行業還是通用模型,訓練效果一定會有很大改善。但是,資料跨境面臨很多挑戰,需要在多邊協議等方面做更多的事,更多去擁抱國際組織,讓國際的資料能夠雙向流通。

香港科技大學助理教授、香港生成式人工智慧研發中心資深商業拓展經理韓斯睿認為,現有的智慧財產權保護制度,其實在智力產品的生成物層面就已截斷,在生成式人工智慧訓練的token級別如何確權、如何保護,並沒有共識。所以在資料脫離原本形態進入token新形態時如何進行確權保護,是法律和政策方面的一個癥結,如果這個癥結打通了,相信會極大地促進知識共享和流通發展。

澎湃新聞記者 秦盛

(本文來自澎湃新聞,更多原創資訊請下載“澎湃新聞”APP)

在生成式AI(人工智慧)時代,資料安全的出路可能會是“用魔法打敗魔法”,智慧財產權保護也可能要提前到token(字串)層面。

4月26日,在2024中關村論壇上,人工智慧企業與學者就AI大模型的資料安全問題進行了討論。

中關村論壇資料安全治理與發展論壇現場 澎湃新聞記者 秦盛 攝

“在生成式人工智慧時代,我們在資料安全層面,面臨的是不斷組合和創造新的資料安全風險的問題,徹底解決這種風險需要演算法和工具的支撐,而不是靠人,或者靠靜態的方法去做相對固定的檢測。”清華大學計算機科學與技術系教授、人工智慧研究院基礎模型研究中心副主任黃民烈如是說道。

他認為,生成式人工智慧可以透過訓練去組合,去生成新的內容,這些內容可能在過去的語料里根本沒出現過,但它依然是有害的。所以,即便把訓練資料處理得很乾淨,在生成式人工智慧時代依然會面臨有害內容產生的情況。

要解決這些問題,需要進行演算法研究,比如針對性對抗攻擊、自動紅隊,然後再加上安全和對齊手段,能夠把問題線上下時就自動進行修復。

奇安信集團副總裁劉前偉表示:“做行業大模型的廠商都很擔心語料會不會被竊取、有沒有漏洞導致這些很核心的資料資產會洩露。這是通用大模型裡過去沒有特別關注的一點。”

劉前偉指出,在進行微調時,防篡改要求非常高,更需要安全,一旦標註錯誤,就會導致安全大模型判斷錯誤。

而對於通用模型的使用,幾乎所有人都會面臨一個問題,就是當我們去問大模型問題時,會不會造成商業機密、個人資訊的洩露。“不管是使用者還是開發者,都要解決隱私安全、商業機密、甚至是國家安全的問題。現在只能用AI對抗AI的方式才能解決內容安全的問題,用過去傳統的流量過濾的方式是無法解決的,所以‘用魔法打敗魔法’可能是一個很大的出路。”劉前偉表示。

IBM資料與轉型諮詢主管合夥人張玉明表示,IBM Global的一份調查報告調研了全球100多個國家和地區的高管對人工智慧的看法,94%的企業高管都認為在部署AI解決方案前要確保模型的安全,但只有24%的企業打算在未來6個月內去引入一些網路安全元件,這就說明大家的認知和實際行動之間還存在延遲。

劉前偉指出,當下面臨的另一個挑戰,是跨境資料流動問題。如果全球的資料都匯聚在一起,不管是行業還是通用模型,訓練效果一定會有很大改善。但是,資料跨境面臨很多挑戰,需要在多邊協議等方面做更多的事,更多去擁抱國際組織,讓國際的資料能夠雙向流通。

香港科技大學助理教授、香港生成式人工智慧研發中心資深商業拓展經理韓斯睿認為,現有的智慧財產權保護制度,其實在智力產品的生成物層面就已截斷,在生成式人工智慧訓練的token級別如何確權、如何保護,並沒有共識。所以在資料脫離原本形態進入token新形態時如何進行確權保護,是法律和政策方面的一個癥結,如果這個癥結打通了,相信會極大地促進知識共享和流通發展。

澎湃新聞記者 秦盛

(本文來自澎湃新聞,更多原創資訊請下載“澎湃新聞”APP)

在生成式AI(人工智慧)時代,資料安全的出路可能會是“用魔法打敗魔法”,智慧財產權保護也可能要提前到token(字串)層面。

4月26日,在2024中關村論壇上,人工智慧企業與學者就AI大模型的資料安全問題進行了討論。

中關村論壇資料安全治理與發展論壇現場 澎湃新聞記者 秦盛 攝

“在生成式人工智慧時代,我們在資料安全層面,面臨的是不斷組合和創造新的資料安全風險的問題,徹底解決這種風險需要演算法和工具的支撐,而不是靠人,或者靠靜態的方法去做相對固定的檢測。”清華大學計算機科學與技術系教授、人工智慧研究院基礎模型研究中心副主任黃民烈如是說道。

他認為,生成式人工智慧可以透過訓練去組合,去生成新的內容,這些內容可能在過去的語料里根本沒出現過,但它依然是有害的。所以,即便把訓練資料處理得很乾淨,在生成式人工智慧時代依然會面臨有害內容產生的情況。

要解決這些問題,需要進行演算法研究,比如針對性對抗攻擊、自動紅隊,然後再加上安全和對齊手段,能夠把問題線上下時就自動進行修復。

奇安信集團副總裁劉前偉表示:“做行業大模型的廠商都很擔心語料會不會被竊取、有沒有漏洞導致這些很核心的資料資產會洩露。這是通用大模型裡過去沒有特別關注的一點。”

劉前偉指出,在進行微調時,防篡改要求非常高,更需要安全,一旦標註錯誤,就會導致安全大模型判斷錯誤。

而對於通用模型的使用,幾乎所有人都會面臨一個問題,就是當我們去問大模型問題時,會不會造成商業機密、個人資訊的洩露。“不管是使用者還是開發者,都要解決隱私安全、商業機密、甚至是國家安全的問題。現在只能用AI對抗AI的方式才能解決內容安全的問題,用過去傳統的流量過濾的方式是無法解決的,所以‘用魔法打敗魔法’可能是一個很大的出路。”劉前偉表示。

IBM資料與轉型諮詢主管合夥人張玉明表示,IBM Global的一份調查報告調研了全球100多個國家和地區的高管對人工智慧的看法,94%的企業高管都認為在部署AI解決方案前要確保模型的安全,但只有24%的企業打算在未來6個月內去引入一些網路安全元件,這就說明大家的認知和實際行動之間還存在延遲。

劉前偉指出,當下面臨的另一個挑戰,是跨境資料流動問題。如果全球的資料都匯聚在一起,不管是行業還是通用模型,訓練效果一定會有很大改善。但是,資料跨境面臨很多挑戰,需要在多邊協議等方面做更多的事,更多去擁抱國際組織,讓國際的資料能夠雙向流通。

香港科技大學助理教授、香港生成式人工智慧研發中心資深商業拓展經理韓斯睿認為,現有的智慧財產權保護制度,其實在智力產品的生成物層面就已截斷,在生成式人工智慧訓練的token級別如何確權、如何保護,並沒有共識。所以在資料脫離原本形態進入token新形態時如何進行確權保護,是法律和政策方面的一個癥結,如果這個癥結打通了,相信會極大地促進知識共享和流通發展。

澎湃新聞記者 秦盛

(本文來自澎湃新聞,更多原創資訊請下載“澎湃新聞”APP)

在生成式AI(人工智慧)時代,資料安全的出路可能會是“用魔法打敗魔法”,智慧財產權保護也可能要提前到token(字串)層面。

4月26日,在2024中關村論壇上,人工智慧企業與學者就AI大模型的資料安全問題進行了討論。

中關村論壇資料安全治理與發展論壇現場 澎湃新聞記者 秦盛 攝

“在生成式人工智慧時代,我們在資料安全層面,面臨的是不斷組合和創造新的資料安全風險的問題,徹底解決這種風險需要演算法和工具的支撐,而不是靠人,或者靠靜態的方法去做相對固定的檢測。”清華大學計算機科學與技術系教授、人工智慧研究院基礎模型研究中心副主任黃民烈如是說道。

他認為,生成式人工智慧可以透過訓練去組合,去生成新的內容,這些內容可能在過去的語料里根本沒出現過,但它依然是有害的。所以,即便把訓練資料處理得很乾淨,在生成式人工智慧時代依然會面臨有害內容產生的情況。

要解決這些問題,需要進行演算法研究,比如針對性對抗攻擊、自動紅隊,然後再加上安全和對齊手段,能夠把問題線上下時就自動進行修復。

奇安信集團副總裁劉前偉表示:“做行業大模型的廠商都很擔心語料會不會被竊取、有沒有漏洞導致這些很核心的資料資產會洩露。這是通用大模型裡過去沒有特別關注的一點。”

劉前偉指出,在進行微調時,防篡改要求非常高,更需要安全,一旦標註錯誤,就會導致安全大模型判斷錯誤。

而對於通用模型的使用,幾乎所有人都會面臨一個問題,就是當我們去問大模型問題時,會不會造成商業機密、個人資訊的洩露。“不管是使用者還是開發者,都要解決隱私安全、商業機密、甚至是國家安全的問題。現在只能用AI對抗AI的方式才能解決內容安全的問題,用過去傳統的流量過濾的方式是無法解決的,所以‘用魔法打敗魔法’可能是一個很大的出路。”劉前偉表示。

IBM資料與轉型諮詢主管合夥人張玉明表示,IBM Global的一份調查報告調研了全球100多個國家和地區的高管對人工智慧的看法,94%的企業高管都認為在部署AI解決方案前要確保模型的安全,但只有24%的企業打算在未來6個月內去引入一些網路安全元件,這就說明大家的認知和實際行動之間還存在延遲。

劉前偉指出,當下面臨的另一個挑戰,是跨境資料流動問題。如果全球的資料都匯聚在一起,不管是行業還是通用模型,訓練效果一定會有很大改善。但是,資料跨境面臨很多挑戰,需要在多邊協議等方面做更多的事,更多去擁抱國際組織,讓國際的資料能夠雙向流通。

香港科技大學助理教授、香港生成式人工智慧研發中心資深商業拓展經理韓斯睿認為,現有的智慧財產權保護制度,其實在智力產品的生成物層面就已截斷,在生成式人工智慧訓練的token級別如何確權、如何保護,並沒有共識。所以在資料脫離原本形態進入token新形態時如何進行確權保護,是法律和政策方面的一個癥結,如果這個癥結打通了,相信會極大地促進知識共享和流通發展。

澎湃新聞記者 秦盛

(本文來自澎湃新聞,更多原創資訊請下載“澎湃新聞”APP)

上一篇:推出多元化消... 下一篇:人文社會科學...
猜你喜歡
熱門閱讀
同類推薦