專家解讀｜構(gòu)建面向AI時(shí)代的數(shù)據(jù)治理新生態(tài)

發(fā)布日期：2023-10-07 瀏覽次數(shù)：1990 發(fā)布者：

生成式人工智能技術(shù)作為具有文本、圖片、音頻、視頻等內(nèi)容生成能力的模型及相關(guān)技術(shù)，正在世界范圍內(nèi)推動(dòng)掀起一輪人工智能發(fā)展的新高潮。一方面，生成式人工智能帶來新的發(fā)展機(jī)遇，包括新的技術(shù)支持、新的業(yè)務(wù)類型和新的應(yīng)用內(nèi)容；另一方面，生成式人工智能也伴生來源更為多樣、程度更為深刻的安全風(fēng)險(xiǎn)，涵蓋各類技術(shù)要素風(fēng)險(xiǎn)和數(shù)字內(nèi)容風(fēng)險(xiǎn)等。如何充分發(fā)揮生成式人工智能的價(jià)值潛能并有效實(shí)現(xiàn)其規(guī)范治理，已是各國共同關(guān)注的時(shí)代命題。

2023年7月13日，國家網(wǎng)信辦聯(lián)合國家發(fā)展改革委、教育部、科技部、工業(yè)和信息化部、公安部和廣電總局公布《生成式人工智能服務(wù)管理暫行辦法》（以下稱《辦法》），自2023年8月15日起施行。《辦法》作為全球第一部關(guān)于生成式人工智能治理的專門法律規(guī)范，具有重大意義。

《辦法》的謀篇布局堅(jiān)持發(fā)展和安全并重的立法精神，規(guī)則的字里行間突出高質(zhì)量發(fā)展新階段語境下綜合治理的生態(tài)理念，是促進(jìn)生成式人工智能技術(shù)健康發(fā)展和規(guī)范應(yīng)用的有力舉措。

一方面，《辦法》的條文設(shè)計(jì)在數(shù)據(jù)治理、算法設(shè)計(jì)、內(nèi)容管理、虛假信息防范以及權(quán)益保護(hù)等多個(gè)層面，圍繞生成式人工智能服務(wù)劃定了全方位的合規(guī)要求；另一方面，《辦法》強(qiáng)調(diào)與《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》《個(gè)人信息保護(hù)法》《科學(xué)技術(shù)進(jìn)步法》等上位法律，以及《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》等現(xiàn)行規(guī)范構(gòu)成的治理框架緊密銜接，形成關(guān)于生成式人工智能服務(wù)的立體規(guī)則體系。

從系統(tǒng)治理論的角度，可以認(rèn)為生成式人工智能的三大核心要素包括數(shù)據(jù)、算力和算法：海量數(shù)據(jù)被認(rèn)為是生成式人工智能的基石，充沛算力是生成式人工智能的基礎(chǔ)能力支撐，先進(jìn)算法是生成式人工智能的基本實(shí)現(xiàn)途徑。應(yīng)當(dāng)指出的是，《辦法》的各項(xiàng)制度規(guī)范深刻洞察生成式人工智能的技術(shù)原理及其運(yùn)行邏輯，特別是在《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》《個(gè)人信息保護(hù)法》等法律、行政法規(guī)的基礎(chǔ)上，著眼生成式人工智能服務(wù)語境下的數(shù)據(jù)治理，引入了多項(xiàng)專門規(guī)范，對于構(gòu)建面向AI時(shí)代的數(shù)據(jù)治理新生態(tài)具有重要的制度指引意義：

其一，《辦法》明確了生成式人工智能服務(wù)中的數(shù)據(jù)治理要求。《辦法》規(guī)定提供和使用生成式人工智能服務(wù)，應(yīng)當(dāng)遵守法律、行政法規(guī)，尊重社會(huì)公德和倫理道德，明確了新技術(shù)場景下數(shù)據(jù)新治理的價(jià)值底蘊(yùn)。同時(shí)，《辦法》要求在算法設(shè)計(jì)、訓(xùn)練數(shù)據(jù)選擇、模型生成和優(yōu)化、提供服務(wù)等過程中，采取有效措施防止民族、信仰、國別、地域、性別、年齡、職業(yè)、健康等歧視，強(qiáng)調(diào)在數(shù)據(jù)治理中防止偏見和歧視，并為生成式人工智能服務(wù)的可持續(xù)發(fā)展提供價(jià)值保障。

其二，《辦法》強(qiáng)調(diào)了生成式人工智能服務(wù)中數(shù)據(jù)處理的特別要求。一方面，《辦法》就相關(guān)數(shù)據(jù)處理活動(dòng)規(guī)定了明晰的行為規(guī)則，生成式人工智能服務(wù)提供者在依法開展預(yù)訓(xùn)練、優(yōu)化訓(xùn)練等訓(xùn)練數(shù)據(jù)處理活動(dòng)中，一是應(yīng)當(dāng)使用具有合法來源的數(shù)據(jù)和基礎(chǔ)模型；二是涉及個(gè)人信息的，應(yīng)當(dāng)取得個(gè)人同意或者符合法律、行政法規(guī)規(guī)定的其他情形；三是采取有效措施提高訓(xùn)練數(shù)據(jù)質(zhì)量，增強(qiáng)訓(xùn)練數(shù)據(jù)的真實(shí)性、準(zhǔn)確性、客觀性、多樣性。

另一方面，《辦法》就相關(guān)數(shù)據(jù)標(biāo)注活動(dòng)設(shè)定了專門的業(yè)務(wù)規(guī)則，規(guī)定在生成式人工智能技術(shù)研發(fā)過程中進(jìn)行數(shù)據(jù)標(biāo)注的，提供者應(yīng)當(dāng)制定符合辦法要求的清晰、具體、可操作的標(biāo)注規(guī)則；開展數(shù)據(jù)標(biāo)注質(zhì)量評估，抽樣核驗(yàn)標(biāo)注內(nèi)容的準(zhǔn)確性；對標(biāo)注人員進(jìn)行必要培訓(xùn)，提升尊法守法意識(shí)，監(jiān)督指導(dǎo)標(biāo)注人員規(guī)范開展標(biāo)注工作?！掇k法》關(guān)于標(biāo)注規(guī)則、質(zhì)量評估和人員培訓(xùn)的組合要求有益于數(shù)據(jù)資源的理解與利用，進(jìn)而提高相關(guān)數(shù)據(jù)處理的準(zhǔn)確性及其效能。

其三，《辦法》突出了生成式人工智能服務(wù)中數(shù)據(jù)生態(tài)的多方協(xié)同。《辦法》一是強(qiáng)調(diào)支持行業(yè)組織、企業(yè)、教育和科研機(jī)構(gòu)、公共文化機(jī)構(gòu)、有關(guān)專業(yè)機(jī)構(gòu)等在生成式人工智能技術(shù)創(chuàng)新、數(shù)據(jù)資源建設(shè)、轉(zhuǎn)化應(yīng)用、風(fēng)險(xiǎn)防范等方面開展協(xié)作，旨在最大程度激發(fā)各方主體的積極性和參與度，提升共建共治共享的數(shù)據(jù)生態(tài)水平。二是強(qiáng)調(diào)推動(dòng)生成式人工智能基礎(chǔ)設(shè)施和公共訓(xùn)練數(shù)據(jù)資源平臺(tái)建設(shè)，促進(jìn)算力資源協(xié)同共享，提升算力資源利用效能，推動(dòng)公共數(shù)據(jù)分類分級有序開放，擴(kuò)展高質(zhì)量的公共訓(xùn)練數(shù)據(jù)資源，鼓勵(lì)采用安全可信的芯片、軟件、工具、算力和數(shù)據(jù)資源。從基礎(chǔ)設(shè)施到平臺(tái)建設(shè)，從算力資源到公共數(shù)據(jù)，《辦法》的規(guī)范設(shè)計(jì)有利于形成多方參與、安全可信的高質(zhì)量數(shù)據(jù)生態(tài)。

作者：吳沈括北京師范大學(xué)法學(xué)院博士生導(dǎo)師、中國互聯(lián)網(wǎng)協(xié)會(huì)研究中心副主任

本文轉(zhuǎn)載自：安徽省網(wǎng)信辦，原文鏈接：http://www.ahwx.gov.cn/wlyj/202308/t20230829_7048034.html

0566-3386000

專題專欄

專家解讀｜構(gòu)建面向AI時(shí)代的數(shù)據(jù)治理新生態(tài)