本文擬基于海問自行總結(jié)的監(jiān)管架構(gòu)(見下圖),就《辦法》相較于征求意見稿的主要迭代亮點作出解讀,幫助讀者快速掌握生成式AI立法的最終基調(diào)。

一、適用范圍:明確排除未向境內(nèi)公眾提供服務(wù)場景、客觀開展外資監(jiān)管
(一)內(nèi)容和技術(shù)服務(wù)提供者均將受到監(jiān)管
不同于《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》明確區(qū)分了“深度合成服務(wù)提供者”和“深度合成服務(wù)技術(shù)支持者”兩類義務(wù)主體,《辦法》僅規(guī)定了“生成式人工智能服務(wù)提供者”。鑒于《辦法》明確將“通過提供可編程接口等方式”提供服務(wù)納入監(jiān)管范圍,亦對模型訓(xùn)練作出了相應(yīng)監(jiān)管要求,因而我們理解,除了直接提供服務(wù)的內(nèi)容服務(wù)提供者,技術(shù)服務(wù)提供者也被涵蓋在“生成式人工智能服務(wù)提供者”的范圍項下。
至于《辦法》未區(qū)分技術(shù)服務(wù)提供者和內(nèi)容服務(wù)提供者的原因,或在于當(dāng)前尚無法就最終生成內(nèi)容實現(xiàn)明確的責(zé)任分割。當(dāng)前實踐中的業(yè)態(tài)較為復(fù)雜,最終違法內(nèi)容的生成可能來源于多方因素,區(qū)分義務(wù)主體的同時即需要在規(guī)范層面對違法內(nèi)容生成責(zé)任作出統(tǒng)一劃分,但在業(yè)務(wù)實踐快速發(fā)展的情況下預(yù)設(shè)規(guī)則難免與實踐情況存在沖突之處。因此《辦法》對“生成式人工智能服務(wù)提供者”作出寬泛定義,實踐中的具體責(zé)任分配有待個案判定。
(二)未向境內(nèi)公眾提供服務(wù)的研發(fā)、自用明確不適用《辦法》
相較于征求意見稿,《辦法》新增第2條第三款,明確將企業(yè)、教育和科研機(jī)構(gòu)、公共文化機(jī)構(gòu)等研發(fā)、應(yīng)用生成式AI技術(shù),未向境內(nèi)公眾提供生成式AI服務(wù)的場景排除在適用范圍之外。除了對技術(shù)創(chuàng)新具有關(guān)鍵作用的科研領(lǐng)域,生成式AI在企業(yè)內(nèi)部的應(yīng)用可以大幅提高企業(yè)生產(chǎn)效率,對我國數(shù)字經(jīng)濟(jì)發(fā)展具有重要意義。結(jié)合我們的項目經(jīng)驗,能夠節(jié)省成本且提高專業(yè)化程度的行業(yè)大模型業(yè)已成為新的關(guān)注熱點。
備受關(guān)注的一個問題是:to B服務(wù)是否可以豁免適用?解題核心在于如何理解“公眾”。中國法語境下,“公眾”是一個泛指,涵蓋了個人和集體(例如組織、團(tuán)體等),故解讀法條難以直接得出to B服務(wù)可以豁免適用的結(jié)論。但就具體的場景該如何判斷,則值得多推敲,例如:平臺只給其上商戶提供服務(wù),商戶也不會基于此再面向C提供服務(wù),相當(dāng)于只是平臺內(nèi)嵌的服務(wù)工具。此種情況和內(nèi)部使用較為類似,而與一般的to B服務(wù)有所區(qū)別。
(三)將境外服務(wù)、外商投資客觀納入監(jiān)管范疇
相較于征求意見稿,《辦法》新增了外商投資條款,要求其符合外商投資相關(guān)法律、行政法規(guī)的規(guī)定,但目前針對生成式AI的外商投資規(guī)定尚不明確。同時,明確規(guī)定若境外向境內(nèi)提供的生成式AI服務(wù)違反中國法律、法規(guī)、《辦法》,國家網(wǎng)信部門應(yīng)通知有關(guān)機(jī)構(gòu)采取技術(shù)措施和其他必要措施予以處置,此條既為對監(jiān)管部門的授權(quán)性規(guī)定,亦為對提供者的警示性規(guī)定。對于“封裝”類的境內(nèi)服務(wù)提供者,其境外技術(shù)支持存在因合規(guī)問題而中斷的可能。《辦法》明確將對境外服務(wù)及外商投資進(jìn)行監(jiān)管但視角較為客觀,一方面注重針對境內(nèi)公眾、公共利益的全面保護(hù),另一方面也有利于促進(jìn)國內(nèi)生成式AI市場的競爭。
二、模型訓(xùn)練:提出多層次規(guī)范體系、數(shù)據(jù)質(zhì)量要求更加務(wù)實
如上文所言,內(nèi)容和技術(shù)服務(wù)提供者均為《辦法》項下的義務(wù)主體,但在模型訓(xùn)練階段,相關(guān)義務(wù)責(zé)任則僅落于技術(shù)服務(wù)提供者,該等義務(wù)分配與現(xiàn)實情況相符。《辦法》第7條明確針對“訓(xùn)練數(shù)據(jù)處理活動”提出要求,意味著負(fù)責(zé)模型訓(xùn)練的技術(shù)服務(wù)提供者應(yīng)當(dāng)遵守相應(yīng)義務(wù)并承擔(dān)責(zé)任,而既不參與模型訓(xùn)練、亦不從事訓(xùn)練數(shù)據(jù)處理活動的內(nèi)容服務(wù)提供者則被排除在外。
(一)僅就自身訓(xùn)練數(shù)據(jù)獲取這一次流轉(zhuǎn)的合法性負(fù)責(zé)
征求意見稿要求“提供者對訓(xùn)練數(shù)據(jù)來源的合法性負(fù)責(zé)”,而《辦法》第7條將其修改為“使用具有合法來源的數(shù)據(jù)和基礎(chǔ)模型”。對此我們理解,《辦法》一方面對“基礎(chǔ)模型來源合法”增設(shè)要求,另一方面也明確了提供者對“訓(xùn)練數(shù)據(jù)來源合法”的合規(guī)義務(wù)邊界。
所謂“數(shù)據(jù)來源合法”,是指通過合法手段、而非竊取等非法方式獲取數(shù)據(jù)。在征求意見稿中,數(shù)據(jù)來源合法要求指向訓(xùn)練數(shù)據(jù)本身,而該訓(xùn)練數(shù)據(jù)可能歷經(jīng)多次流轉(zhuǎn),如果其中某次流轉(zhuǎn)存在非法獲取的情況(即存在原罪),不排除提供者需為此承擔(dān)責(zé)任的可能。而在《辦法》中,數(shù)據(jù)來源合法要求明確指向本次訓(xùn)練數(shù)據(jù)使用行為,關(guān)注重點聚焦于提供者為使用而獲取訓(xùn)練數(shù)據(jù)這一次流轉(zhuǎn)經(jīng)歷,提供者的責(zé)任范圍由此得到了限縮。
除此之外,《辦法》提出推動公共訓(xùn)練數(shù)據(jù)資源平臺建設(shè),亦將為“數(shù)據(jù)來源合法”提供基礎(chǔ)保障。《辦法》第6條第二款規(guī)定,要推動公共數(shù)據(jù)分類分級有序開放,擴(kuò)展高質(zhì)量的公共訓(xùn)練數(shù)據(jù)資源。與之相對,2023年5月23日出臺的《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施》中亦提及將從“歸集高質(zhì)量基礎(chǔ)訓(xùn)練數(shù)據(jù)集”、“謀劃建設(shè)數(shù)據(jù)訓(xùn)練基地”、“搭建數(shù)據(jù)集精細(xì)化標(biāo)注眾包服務(wù)平臺”三方面入手,提升高質(zhì)量數(shù)據(jù)要素供給能力。隨著數(shù)據(jù)壟斷效應(yīng)的加劇,企業(yè)若想合法獲取高質(zhì)量的訓(xùn)練數(shù)據(jù)集并非易事,而日后公共訓(xùn)練數(shù)據(jù)集的建立和開放或?qū)⒂行Ь徑膺@一矛盾,降低企業(yè)獲取具有合法來源的數(shù)據(jù)的成本。
不過,深入探究“數(shù)據(jù)來源合法”的含義,會發(fā)現(xiàn)其中亦存在模糊之處。例如,在服務(wù)提供者從第三方購買訓(xùn)練數(shù)據(jù)集的情況下,在數(shù)據(jù)交易所進(jìn)行交易是否就必然可被認(rèn)定為數(shù)據(jù)來源合法?如果是場外交易,僅靠要求數(shù)據(jù)提供方作出合規(guī)承諾,是否即滿足要求?服務(wù)提供者事先是否需要進(jìn)行盡職調(diào)查,是否需要數(shù)據(jù)提供方出示相關(guān)憑證以作證明?此類實操問題仍有待實踐中進(jìn)一步明確。
(二)不再要求對訓(xùn)練數(shù)據(jù)質(zhì)量作出保證
相較于征求意見稿,《辦法》對訓(xùn)練數(shù)據(jù)的質(zhì)量要求從“保證數(shù)據(jù)的真實性、準(zhǔn)確性、客觀性、多樣性”軟化為了“采取有效措施提高訓(xùn)練數(shù)據(jù)質(zhì)量,增強(qiáng)訓(xùn)練數(shù)據(jù)的真實性、準(zhǔn)確性、客觀性、多樣性”。訓(xùn)練數(shù)據(jù)的質(zhì)量對于最終生成內(nèi)容的質(zhì)量具有重要影響,如果訓(xùn)練數(shù)據(jù)中即存在大量虛假、有害信息,那最終生成結(jié)果也難以言及真實準(zhǔn)確,因而有必要對訓(xùn)練數(shù)據(jù)作出要求。但是,由于模型訓(xùn)練需要海量數(shù)據(jù),要求服務(wù)提供者對數(shù)據(jù)質(zhì)量作出保證不僅會帶來高昂的合規(guī)成本,亦缺乏可行性。不過還需注意的是,《辦法》對數(shù)據(jù)質(zhì)量提升措施提出了“有效性”要求,因此仍不可大意相關(guān)合規(guī)措施的具體落實。
除此之外,相較于征求意見稿提出的人工標(biāo)注規(guī)則和抽樣核驗要求,《辦法》不僅關(guān)注到數(shù)據(jù)標(biāo)注不僅限于人工標(biāo)注的實踐情況(實際上多數(shù)標(biāo)注均非人工完成),擴(kuò)張了數(shù)據(jù)標(biāo)注要求的適用范圍,還新增設(shè)了數(shù)據(jù)標(biāo)注質(zhì)量評估要求。我們理解,日后此項亦將成為安全評估和算法備案的審查要點,建議企業(yè)事先作出合規(guī)部署。
三、內(nèi)容運營管理:內(nèi)容真實向善為目標(biāo)、措施要求可落地性增強(qiáng)
(一)放寬生成內(nèi)容的真實準(zhǔn)確要求
《辦法》刪除了征求意見稿中爭議較大的“生成內(nèi)容應(yīng)當(dāng)真實準(zhǔn)確”要求,將其修改為了“提高生成內(nèi)容的準(zhǔn)確性和可靠性”。目前而言,“幻覺”源于大模型的固有技術(shù)缺陷,實踐中尚且無法避免,在此背景下要求生成內(nèi)容完全真實準(zhǔn)確并不現(xiàn)實,因而《辦法》對征求意見稿進(jìn)行了修改,將結(jié)果性要求放寬為過程性要求。與之相對,企業(yè)應(yīng)采取內(nèi)容審核等合規(guī)措施證明其盡到了相應(yīng)義務(wù)。
例如,OpenAI采用了兩種技術(shù)方法以降低模型幻覺出現(xiàn)的頻率。對于開放域的幻覺,OpenAI收集了ChatGPT被用戶標(biāo)為不真實的現(xiàn)實世界數(shù)據(jù),以及用于訓(xùn)練獎勵模型的對比標(biāo)注數(shù)據(jù);對于封閉域的幻覺,OpenAI設(shè)計了一系列步驟以使用GPT-4自行生成對比數(shù)據(jù),并最終將生成結(jié)果準(zhǔn)確性提升了30%左右。[1]
(二)刪除模型優(yōu)化訓(xùn)練的效果要求和時間限定
《辦法》要求服務(wù)提供者在發(fā)現(xiàn)違法內(nèi)容后采取模型優(yōu)化訓(xùn)練等措施進(jìn)行整改,刪除了征求意見稿中“3個月內(nèi)通過模型優(yōu)化訓(xùn)練等方式防止再次生成”的要求。我們理解,無論是“3個月內(nèi)”的時間限定,還是“防止再次生成”的效果目標(biāo),都對服務(wù)提供者提出了較為嚴(yán)苛的技術(shù)要求,實踐中可能難以落地,所以《辦法》對該條款作出了修改。不過另需注意的是,《辦法》新增了向主管部門報告的義務(wù)要求,對此需要提供者建立相應(yīng)機(jī)制以作回應(yīng)。
四、通用運營管理:用戶保護(hù)更加精細(xì)、用戶管理契合實踐
(一)“防依賴沉迷義務(wù)”明確指向未成年人用戶群體
征求意見稿第10條規(guī)定,提供者應(yīng)“采取適當(dāng)措施防范用戶過分依賴或沉迷生成內(nèi)容”,《辦法》第10條將該表述修改為提供者應(yīng)“采取有效措施防范未成年人用戶過度依賴或者沉迷生成式人工智能服務(wù)”。
具體而言,《辦法》從保護(hù)對象和措施效果兩方面入手,對上述防依賴沉迷義務(wù)進(jìn)行了修訂:
從保護(hù)對象來看,《辦法》將保護(hù)對象具體界定為未成年人用戶。正如我們在之前的文章《生成式AI(二):體系化構(gòu)建合規(guī)指南》中所分析,結(jié)合《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》的未成年人保護(hù)條款進(jìn)行體系解釋,加之未成年人用戶心智發(fā)育尚不成熟,更容易受到生成式AI影響,建立未成年人保護(hù)機(jī)制是生成式AI服務(wù)防依賴沉迷義務(wù)的應(yīng)然之義。《辦法》的規(guī)定明確印證了我們的觀點。
從措施效果來看,一方面,《辦法》將“適當(dāng)措施”修改為“有效措施”,提高了合規(guī)措施的效果標(biāo)準(zhǔn);另一方面,《辦法》將“依賴或沉迷生成內(nèi)容”修改為“依賴或沉迷生成式人工智能服務(wù)”,表述更加精準(zhǔn)且合理。因為相較于具體的生成內(nèi)容,未成年人更可能過度依賴或沉迷于服務(wù)功能本身,導(dǎo)致無法充分鍛煉獨立思考能力,阻礙未成年人的健康成長,當(dāng)前世界范圍內(nèi)多所學(xué)校禁用ChatGPT亦為此理。
(二)新增服務(wù)協(xié)議簽訂義務(wù)
相較于征求意見稿,《辦法》第9條要求服務(wù)提供者與使用者簽訂服務(wù)協(xié)議,明確雙方權(quán)利義務(wù)。目前而言,簽訂服務(wù)協(xié)議已成為提供生成式AI服務(wù)的實踐慣例,該項規(guī)定繼而將此舉從實踐慣例上升到了法定義務(wù)層面。我們理解,服務(wù)協(xié)議不僅對劃定雙方權(quán)利義務(wù)具有重要意義,亦會落入安全評估、算法備案中用戶權(quán)益保障情況的審查范疇。對此,我們將結(jié)合自身實務(wù)經(jīng)驗,在后續(xù)推送中專就生成式AI服務(wù)法律文本的合規(guī)要點作出解讀,敬請期待。
(三)違法行為處置不再限于“暫停或終止服務(wù)”
五、監(jiān)管工具:基于風(fēng)險的分類分級治理
《生成式人工智能服務(wù)管理暫行辦法》
與征求意見稿對比匯總








[1] OpenAI: GPT-4 Technical Report, https://arxiv.org/pdf/2303.08774.pdf
京ICP備05019364號-1
京公網(wǎng)安備110105011258