在线观看一区二区三区三州_日韩精品免费播放_日韩中文娱乐网_日韩欧美一区二

2023-06-21

生成式AI(二):體系化構建合規指南

作者: 楊建媛 李天爍





內容治理是生成式AI監管的關注重點。一方面,基于客觀維度,生成式AI可能會生成不真實或無意義的內容,即具有“幻覺”傾向;另一方面,結合價值判斷,生成式AI還存在生成有害內容的問題。如本系列首篇《生成式AI(一):嘗試參透監管的底層邏輯》所分析,生成式AI監管的底層邏輯在于引導對人類的良性影響。為了實現這一目標,監管規則對企業提出了一系列合規要求,旨在彌補生成式AI的固有缺陷,降低其應用風險。本文擬對我國生成式AI的監管規則進行體系化梳理,以期為企業的合規實踐提供指引

微信截圖_20230621173038.png

一、模型訓練:確保來源合法、提升數據質量



(一)保障訓練數據來源的合法性

生成式AI的訓練通常需要TB級的海量數據。數據來源的合法性為生成式AI合規的基礎性要求,其包括但不限于知識產權、個人信息保護。
1.知識產權
《生成式人工智能服務管理辦法(征求意見稿)》(“《生成式人工智能服務辦法》”)第七條中明確要求,用于生成式AI產品的預訓練、優化訓練數據(“訓練數據”),應不含有侵犯知識產權的內容。
我國《著作權法》過去明確列舉了十二種“合理使用”的情形,并在2020年修改時新增了“法律、行政法規規定的其他情形”這一兜底條款,但企業為訓練生成式AI而使用他人作品通常無法符合“合理使用”的任一情形,如無授權則存在知識產權侵權風險。我國目前并未通過“柔性合理使用條款”(如日本法)等方式為生成式AI等新技術設置特殊的合理使用情形,亦未通過“四要素分析法”(如美國法)等方式僅規定合理使用的判斷因素而不對其適用情形作列舉限定。盡管我國司法實踐中確偶有突破《著作權法》額外創設“合理使用”情形的特例,但在現有規則體系下,如何取得作品使用授權/避免使用作品進行訓練,是相關大模型企業在目前無法回避的一個問題
生成式AI訓練數據的知識產權問題已在境內外引起了諸多爭議,例如:美國AI繪畫軟件Stable Diffusion的開發商Stability AI即因未經授權爬取1200余萬張圖像用于大模型訓練而遭到起訴,該案正在進展中,合理使用問題系該案爭議焦點之一[1];在可能成為中國“AI大模型數據被盜第一案”的筆神作文與學而思的糾紛中,亦涉及到著作權侵權的相關爭論。[2]
鑒于訓練數據的龐大規模,確保其中不含有任何侵犯知識產權的內容,對于相關企業來說存在相當高的實現難度。我國現有監管規則尚未對此提供更加細化的合規指引,但歐盟一周前剛剛通過的《人工智能法案》草案或可提供借鑒思路——其要求生成式AI的基礎模型提供者應針對其訓練模型所使用的任何受著作權保護的材料,記錄并公開披露詳細的使用情況摘要。這一透明度方案或可有效降低著作權人的維權難度,但也相應對開發者提出了更高的合規要求。
2.個人信息保護
《生成式人工智能服務辦法》第七條中明確要求,訓練數據包含個人信息的,應當征得個人信息主體同意或者符合法律、行政法規規定的其他情形。
OpenAI表示:“我們希望(模型)了解世界,而非了解個人”,并承諾將在可行的范圍內盡量刪除訓練數據集中所包含的互聯網上公開可獲得的個人信息。[3]與之相呼應,有觀點主張模型訓練不適用個人信息保護相關法規,或至少應從個人信息保護角度對模型訓練予以豁免。然而,僅從現行法的角度,在訓練數據包含個人信息的情況下,盡管其或并不旨在對自然人進行識別,但將數據用于模型訓練的行為通常仍被認為屬于《個人信息保護法》所規定的“處理”,因此需征得個人同意或具備其他合法性基礎
針對訓練數據的個人信息保護要求并非中國所獨有,2023年3月,意大利數據監管機關Garante對ChatGPT發布了臨時禁令,原因之一即在于OpenAI的個人信息收集及以算法訓練為目的的處理活動缺乏合法性基礎。此后,OpenAI通過在網站公布訓練算法的個人信息處理情況、明確正當利益(legitimate interest)為利用用戶個人信息進行算法訓練的合法性基礎、允許歐盟個人以便捷方式選擇退出(opt-out)算法訓練等措施進行了整改,恢復了ChatGPT在意大利境內的運營。
3.關于數據來源合法性的爭議
數據來源的合法性要求盡管看起來“天經地義”,但之于生成式AI而言,過于絕對的合法性要求從理論上亦可能涉及以下問題:[4]
首先,數據質量和數據合法性之間存在矛盾。生成式AI的訓練需要海量數據,如果對預訓練數據的合法性作出要求,企業為了規避風險可能會采取過于謹慎的態度,大幅縮減訓練數據數量,甚至可能損害數據的客觀性和多樣性。
其次,訓練數據的合法性并非信息生成合法性的必要條件最初輸入的訓練數據與最終輸出的生成內容并非直接對應關系,其中經歷了較為復雜的轉換過程。
最后,《生成式人工智能服務辦法》的規定在責任承擔方面存在問題。在該規定項下,數據來源合法性要求的義務主體為利用生成式人工智能產品提供聊天和文本、圖像、聲音生成等服務的組織和個人(“提供者”),然而,純粹的服務商可能并不參與模型的訓練開發,也并不具備相應的技術能力,要求其就該項義務承擔責任過于嚴苛。
針對以上問題,界定大模型訓練作為合理使用的情形、標準化解決內容創作者的補償問題、區分主體施以合規義務均為可以探討的解決方案。
(二)訓練數據應具備高質量
相較于“不證自明”的合法性要求,針對訓練數據的質量要求,通常被認為是生成式AI監管的特色規定。監管關注訓練數據質量的邏輯或在于,當人類已難以完全理解具有數百億參數大模型的推理過程時,要求企業采取措施增強訓練數據的真實性、準確性、客觀性、多樣性(例如,設計預訓練數據集時考慮偏遠地區、少數民族等因素,利用分類器及關鍵詞庫對數據集進行過濾等),就成為了為數不多有效可行的監管手段。其原理近似于,當家長無法控制孩子的行為時,至少應確保所教導傳授的內容是積極向善的。
針對訓練數據的質量問題,《生成式人工智能服務辦法》主要存在兩方面的重點考量:一方面,提供者應在算法設計、訓練數據選擇、模型生成和優化、提供服務等過程中,采取措施防止歧視。另一方面,提供者應保證訓練數據的真實性、準確性、客觀性、多樣性

此外,根據《生成式人工智能服務辦法》的要求,為了加強數據質量管理,提供者如果采用了人工標注的方式訓練生成式AI,應當制定清晰、具體、可操作的標注規則,對標注人員進行必要培訓,抽樣核驗標注內容的正確性。實踐中建議企業留存相應的培訓和抽樣核驗記錄,以證明履行了合規義務。

二、運營管理:內容治理為核心,以人為本是基調


(一)內容治理

1.內容治理的多元要求
《生成式人工智能服務辦法》對生成內容的監管要求主要體現在三個方面:首先,生成內容應當體現社會主義核心價值觀,不得含有反動、色情、暴力等內容。該要求與《互聯網信息服務管理辦法》《網絡信息內容生態治理規定》《互聯網信息服務算法推薦管理規定》(“《算法推薦管理規定》”)《互聯網信息服務深度合成管理規定》(“《深度合成管理規定》”)一脈相承。其次,生成內容不得帶有歧視性。最后,生成內容應當真實準確,提供者應采取措施提高生成內容的準確性和可靠性、防止生成虛假信息
2.治理措施的多樣手段
首先,“幻覺”目前通常被認為是大模型技術的固有缺陷,目前無法實現100%的準確可靠。如何減少幻覺是大模型研究應用的重點之一,但恐怕難以一蹴而就。例如,根據OpenAI發布的GPT-4技術報告,GPT-4在科技、歷史、商業等各類主題測試集中,其準確率普遍介于60-80%之間,而這已是GPT-4相較于GPT-3.5幻覺程度顯著降低后的結果。
除了前文所提及的提升訓練數據的質量,建立適當的內容審核機制也是彌補該缺陷的方式之一。此處與《深度合成管理規定》和《算法推薦管理規定》的監管要求相銜接:一方面,服務提供者應當加強內容管理,采取技術或者人工方式對服務使用者的輸入數據和合成結果進行審核;另一方面,服務提供者應當建立健全用于識別違法和不良信息的特征庫,完善入庫標準、規則和程序,記錄并留存相關網絡日志。
其次,提供者應依法對生成的圖片、視頻等內容進行標識。標識分為隱式與顯式兩類,兩者并行不悖、不存在替代關系:
  • 隱式標識:提供者應當采取技術措施添加不影響用戶使用的標識,并保存相關日志信息以便進行識別追溯;
  • 顯式標識:對于可能導致公眾混淆或誤認的服務,應由提供者在生成內容的合理位置、區域進行顯著標識;對于前述以外的其他服務,應由提供者提供顯式標識功能,并提示使用者可以進行顯式標識。
標識義務為生成式AI合規的難點問題之一,“可能導致公眾混淆或誤認”的判斷標準、不同模態下的具體標識方案等問題均有待進一步明晰。業界正在內容標識領域不斷探索,例如,抖音于2023年5月發布《抖音關于人工智能生成內容標識的水印與元數據規范》,一方面確定了統一的水印樣式和位置,在提示用戶的同時盡可能減少觀感不適;另一方面規范了人工智能生成內容的元數據格式,在相關圖片和視頻元數據中寫入信息,以達到行業通用識別的效果。[5]
最后,對于模型生成的不當內容,除采取內容過濾等措施外,提供者還應通過模型優化訓練等措施進行整改、防止再次生成。
(二)通用運營管理
1.保護用戶不因使用生成式AI受害
首先,提供者應對用戶輸入信息和使用記錄承擔保護義務,不得將其非法留存、用于用戶畫像或向他人提供,除非法律法規另有規定。
其次,提供者應當明確并公開其服務的適用人群、場合、用途,采取適當措施防范用戶過分依賴或沉迷生成內容。然而《生成式人工智能服務辦法》中的防依賴沉迷條款[6],究竟是適用于全部用戶的普適要求,還是旨在保護兒童、老人等弱勢群體的特殊要求,目前尚不明確。但從體系解釋的角度,結合《生成式人工智能服務辦法》的防依賴沉迷條款與《算法推薦管理規定》的未成年人保護條款[7],我們理解,建立未成年人保護機制是前者的應然之義,但是否還需建立其他機制則需持續觀察監管傾向及市場實踐的發展變化。
在境外,生成式AI服務的年齡過濾機制已受到了監管者的格外關注。2023年2月,意大利數據監管機關Garante就人工智能聊天工具Replika發布了臨時禁令,要求其停止處理意大利人的數據,主要原因之一即在于Replika所提供的虛擬情感關系服務可能會對未成年人造成傷害,但其并未設置年齡驗證機制,致使未成年人可以輕松訪問并使用該服務。[8]以此為鑒,盡管年齡門檻不盡相同,但OpenAI、Google和Microsoft均為用戶注冊和使用其大模型服務設定了一定的年齡限制。
最后,提供者應當建立用戶投訴接收處理機制,及時處置個人關于更正、刪除、屏蔽其個人信息的請求;發現、知悉違法和不良信息時,應當采取措施、停止生成、保存記錄并向監管部門報告,防止危害持續。
2.管理用戶不能使用生成式AI作惡
首先,提供者應當對用戶的真實身份進行驗證。該項規定有助于后續快速識別不良用戶,提高平臺管理能力。其次,提供者應當指導用戶正當使用人工智能生成內容。最后,提供者發現用戶使用生成式AI產品過程中存在違反法律法規,違背商業道德、社會公德行為時,包括從事網絡炒作、惡意發帖跟評、制造垃圾郵件、編寫惡意軟件,實施不正當的商業營銷等,應當暫停或者終止服務。

當前,國內已出現多起利用生成式AI發布虛假新聞的違法案例。例如,2023年4月,甘肅公安發現有不法分子散播題為“今晨甘肅一火車撞上修路工人致9人死亡”的虛假文章,而后查明該文為洪某利用ChatGPT所編輯的內容。洪某散布虛假信息的行為已涉嫌尋釁滋事罪,目前已被警方采取刑事強制措施,該案仍在進展之中。[9]

三、監管工具:算法備案與安全評估并駕齊驅



具有輿論屬性或社會動員能力的互聯網信息服務和相關新技術新應用是監管部門的重點關注對象。《生成式人工智能服務辦法》規定,利用生成式AI產品向公眾提供服務前,應當按照《具有輿論屬性或社會動員能力的互聯網信息服務安全評估規定》向國家網信部門申報安全評估(即“安全評估”、“雙新評估”),并按照《算法推薦管理規定》履行算法備案和變更、注銷備案手續(即“算法備案”)。

需要注意的是,上文所提及的大多為《生成式人工智能服務辦法》這一特殊法對于生成式AI的特殊合規要求,但除此之外提供者還應當同時落實《深度合成管理規定》、《算法推薦管理規定》作為一般法所提出的通用合規要求,包括但不限于落實信息安全主體責任、建立健全用戶注冊、算法機制機理審核、應急處置等一般性管理制度。該等通用合規要求的落實對于企業順利完成算法備案、安全評估有著顯著影響,切不可忽視。

除此之外,提供者負有配合監督檢查的義務。特別地,《生成式人工智能服務辦法》對算法透明度作出要求,提供者應當根據監管部門的要求,提供可以影響用戶信任、選擇的必要信息,包括預訓練和優化訓練數據的來源、規模、類型、質量等描述,人工標注規則,人工標注數據的規模和類型,基礎算法和技術體系等。實踐中建議企業留存前述相關內容的產品文檔、評估報告、日志記錄等,做好響應配合監督檢查的準備。

[1] https://arstechnica.com/tech-policy/2023/04/stable-diffusion-copyright-lawsuits-could-be-a-legal-earthquake-for-ai/

[2] https://mp.weixin.qq.com/s/aRYJbh1UO9RYEJdhL-nivQ

[3] https://openai.com/blog/our-approach-to-ai-safety

[4] https://mp.weixin.qq.com/s/DXgyb-8I2YLoXWN8j0QzAg

[5] https://www.douyin.com/rule/billboard?id=1242800000050

[6] 《生成式人工智能服務辦法》第十條:“提供者應當明確并公開其服務的適用人群、場合、用途,采取適當措施防范用戶過分依賴或沉迷生成內容。”

[7] 《算法推薦管理規定》第十八條:“算法推薦服務提供者向未成年人提供服務的,應當依法履行未成年人網絡保護義務,并通過開發適合未成年人使用的模式、提供適合未成年人特點的服務等方式,便利未成年人獲取有益身心健康的信息。

算法推薦服務提供者不得向未成年人推送可能引發未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好等可能影響未成年人身心健康的信息,不得利用算法推薦服務誘導未成年人沉迷網絡。”

[8] https://www.silicon.co.uk/e-innovation/artificial-intelligence/replika-italy-ban-497135

[9] https://mp.weixin.qq.com/s/_Wfe-EV13O6uBM65jZDzdg


*感謝趙雅澤對本文的突出貢獻

聯系我們
地址:北京市朝陽區東三環中路5號
財富金融中心20層(郵編100020)
電話:+86 10 8560 6888
傳真:+86 10 8560 6999
郵件:haiwenbj@haiwen-law.com
地址:上海市南京西路1515號靜安嘉里中心一座26層(郵編200040)
電話:+86 21 6043 5000
傳真:+86 21 5298 5030
郵件:haiwensh@haiwen-law.com
地址:深圳市福田區中心四路1號
嘉里建設廣場第三座3801室(郵編518048)
電話:+86 755 8323 6000
傳真:+86 755 8323 0187
郵件:haiwensz@haiwen-law.com
地址:香港中環港景街1號 國際金融中心一期6樓601-602及610-616室
電話:+852 3952 2222
傳真:+852 3952 2211
郵件:haiwenhk@haiwen-law.com
地址:成都市高新區交子大道233號
中海國際中心C座20層01、11-12單元(郵編610041)
電話:+86 28 6391 8500
傳真:+86 28 6391 8397
郵件:haiwencd@haiwen-law.com
在线观看一区二区三区三州_日韩精品免费播放_日韩中文娱乐网_日韩欧美一区二
www污在线观看| 欧美性大战久久久久| 久久99欧美| 国产精品av在线| 97精品国产97久久久久久粉红 | 亚洲综合中文字幕在线| 久久国产精品首页| 久久97久久97精品免视看| 7777免费精品视频| 国产伦理久久久| 国产日产欧美精品| 国产欧美va欧美va香蕉在线| 国产日韩欧美黄色| 国产伦精品一区二区三区视频孕妇 | 亚洲一区二区三区乱码| 欧美精品九九久久| 亚洲精品久久区二区三区蜜桃臀 | 久久综合国产精品台湾中文娱乐网| 久久亚洲精品国产亚洲老地址| 精品久久中出| 亚洲精品人成| 日韩精品一区二区三区四 | 欧美极品欧美精品欧美视频| 亚洲成熟丰满熟妇高潮xxxxx| 欧美一区二区三区在线播放| 日韩免费观看高清| 蜜桃成人免费视频| 国产日韩av高清| 久久手机在线视频| 国产精品美女久久久免费| 国产精品久久久久久久久久久久久久| 精品国产乱码久久久久久郑州公司 | 亚洲v日韩v欧美v综合| 日韩久久久久久久久久久久| 精品一区二区三区日本| av天堂永久资源网| 日韩中文在线中文网三级| 插插插亚洲综合网| 少妇一晚三次一区二区三区| 欧美中文字幕精品| 国产日韩一区二区| 国产大尺度在线观看| 国产精品国产三级国产aⅴ浪潮 | 欧美自拍视频在线观看| 成人欧美一区二区三区黑人| 国产成人小视频在线观看| 久久久久久国产精品久久| 人妻内射一区二区在线视频| 国产伦精品一区二区三区照片91| 久久久久久国产三级电影| 一区二区视频在线播放| 欧美精品第三页| 99久久99久久| 国产精品对白一区二区三区| 日韩一二区视频| 国产精品午夜视频| 国产精品视频男人的天堂| 亚洲va男人天堂| 国产裸体写真av一区二区| 国产精品色婷婷视频| 日本精品一区二区| 91蜜桃网站免费观看| 国产精品久久电影观看| 秋霞在线一区二区| 久久这里只有精品8| 色综合久久88色综合天天看泰| 日韩精品欧美一区二区三区| 蜜桃传媒一区二区| zzjj国产精品一区二区| 视频在线99re| av资源站久久亚洲| 欧美成人一区二区三区电影| 欧美精品123| 日韩视频免费大全中文字幕| 日韩无套无码精品| 久久久日本电影| 亚洲精品中文字幕在线| 国产精品一区二区三| 九九热精品在线| 国产资源在线视频| 久久精品国产一区二区三区| 日本婷婷久久久久久久久一区二区| 国产精品亚洲自拍| 色综合久久悠悠| 国产欧美一区二区三区在线 | www国产精品内射老熟女| 欧美精品久久久久久久久久| 国产精品一区二区三区不卡| 久国内精品在线| 国产日产欧美一区二区| 国产精品福利视频| 国产日韩欧美另类| 久久久久成人网| 成人av电影免费| 亚洲资源在线看| 97国产在线视频| 天天干天天色天天爽| 久久99精品久久久久久水蜜桃| 日本久久久久久| 久久精品视频在线| 国模极品一区二区三区| 欧美伦理91i| www.日本少妇| 日本精品久久久久久久久久| 日韩在线欧美在线| 激情内射人妻1区2区3区| 国产精品精品一区二区三区午夜版| 国内精品在线观看视频| 国产精品成人一区二区| 国产欧美日本在线| 亚洲高清在线观看一区| 国产成人亚洲综合无码| 欧美日韩精品免费看| 国产精品久久久999| 成人3d动漫一区二区三区| 欧美一级片免费播放| 国产精品无码一本二本三本色| 国产一区二区视频播放| 亚洲欧洲日本国产| 久久本道综合色狠狠五月| 欧美国产日韩在线播放| 国产精品久久久久久久久久免费| 国产伦精品一区二区三区高清版| 亚洲影视九九影院在线观看| 91精品国产自产在线观看永久| 色综合久久久久无码专区| 日韩一区二区av| 国产一区二中文字幕在线看| 亚洲国产精品www| 国产精品爽黄69| 99久久免费观看| 欧美亚洲国产视频| 一本久道久久综合| www.日韩.com| 国产日韩精品综合网站| 亚洲精品国产精品久久| 国产精品美女诱惑| 91久久精品美女| 国内精品视频免费| 一道精品一区二区三区| 久久久噜噜噜久噜久久| 国产毛片视频网站| 欧洲日韩成人av| 亚洲影视中文字幕| 国产精品色视频| 久久久久久www| 国产伦精品一区二区三区精品视频 | 99久久精品免费看国产一区二区三区| 午夜一区二区三视频在线观看| 日韩在线播放av| 成人黄动漫网站免费| 欧美国产视频在线观看| 亚洲一区二区三区在线视频| 国产精品二区在线观看| 日韩视频在线一区| 91久久精品美女| 国产剧情日韩欧美| 欧美 日韩 国产 在线观看| 婷婷视频在线播放| 久久综合网hezyo| 日韩视频免费大全中文字幕| 91成人福利在线| 成人做爽爽免费视频| 欧美视频在线观看网站| 午夜精品美女自拍福到在线| 久久999免费视频| 国产精品视频网| 国产成人精品最新| 久艹在线免费观看| 久久久婷婷一区二区三区不卡 | 成人伊人精品色xxxx视频| 国产尤物av一区二区三区| 欧美性久久久久| 青青影院一区二区三区四区| 日本午夜在线亚洲.国产| 午夜精品一区二区三区视频免费看| 久久久久久国产精品久久| 国产精品久久久久国产a级| 久久精品美女视频网站| 久久久久久久97| 久久久久久久久91| 国产a级全部精品| 久久精品ww人人做人人爽| 久久免费视频在线观看| 国产成人一区二区三区别| 久久精品日产第一区二区三区| 久久久999免费视频| 久久久午夜视频| 国产成人自拍视频在线观看| 久久偷窥视频| 国产成人精品日本亚洲| 久久免费国产视频| 91久久久在线| 国产精品99久久久久久久久| 91成人精品网站| 久久久久久久香蕉| 精品国模在线视频| 国产精品久久久久久一区二区| 国产精品久久精品| 欧美激情国产精品|