專家解讀|構(gòu)建面向AI時(shí)代的數(shù)據(jù)治理新生態(tài)
發(fā)布日期:2023-10-07 瀏覽次數(shù):1990 發(fā)布者:
生成式人工智能技術(shù)作為具有文本、圖片、音頻、視頻等內(nèi)容生成能力的模型及相關(guān)技術(shù),正在世界范圍內(nèi)推動(dòng)掀起一輪人工智能發(fā)展的新高潮。一方面,生成式人工智能帶來新的發(fā)展機(jī)遇,包括新的技術(shù)支持、新的業(yè)務(wù)類型和新的應(yīng)用內(nèi)容;另一方面,生成式人工智能也伴生來源更為多樣、程度更為深刻的安全風(fēng)險(xiǎn),涵蓋各類技術(shù)要素風(fēng)險(xiǎn)和數(shù)字內(nèi)容風(fēng)險(xiǎn)等。如何充分發(fā)揮生成式人工智能的價(jià)值潛能并有效實(shí)現(xiàn)其規(guī)范治理,已是各國共同關(guān)注的時(shí)代命題。
2023年7月13日,國家網(wǎng)信辦聯(lián)合國家發(fā)展改革委、教育部、科技部、工業(yè)和信息化部、公安部和廣電總局公布《生成式人工智能服務(wù)管理暫行辦法》(以下稱《辦法》),自2023年8月15日起施行。《辦法》作為全球第一部關(guān)于生成式人工智能治理的專門法律規(guī)范,具有重大意義。
《辦法》的謀篇布局堅(jiān)持發(fā)展和安全并重的立法精神,規(guī)則的字里行間突出高質(zhì)量發(fā)展新階段語境下綜合治理的生態(tài)理念,是促進(jìn)生成式人工智能技術(shù)健康發(fā)展和規(guī)范應(yīng)用的有力舉措。
一方面,《辦法》的條文設(shè)計(jì)在數(shù)據(jù)治理、算法設(shè)計(jì)、內(nèi)容管理、虛假信息防范以及權(quán)益保護(hù)等多個(gè)層面,圍繞生成式人工智能服務(wù)劃定了全方位的合規(guī)要求;另一方面,《辦法》強(qiáng)調(diào)與《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》《個(gè)人信息保護(hù)法》《科學(xué)技術(shù)進(jìn)步法》等上位法律,以及《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》等現(xiàn)行規(guī)范構(gòu)成的治理框架緊密銜接,形成關(guān)于生成式人工智能服務(wù)的立體規(guī)則體系。
從系統(tǒng)治理論的角度,可以認(rèn)為生成式人工智能的三大核心要素包括數(shù)據(jù)、算力和算法:海量數(shù)據(jù)被認(rèn)為是生成式人工智能的基石,充沛算力是生成式人工智能的基礎(chǔ)能力支撐,先進(jìn)算法是生成式人工智能的基本實(shí)現(xiàn)途徑。應(yīng)當(dāng)指出的是,《辦法》的各項(xiàng)制度規(guī)范深刻洞察生成式人工智能的技術(shù)原理及其運(yùn)行邏輯,特別是在《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》《個(gè)人信息保護(hù)法》等法律、行政法規(guī)的基礎(chǔ)上,著眼生成式人工智能服務(wù)語境下的數(shù)據(jù)治理,引入了多項(xiàng)專門規(guī)范,對于構(gòu)建面向AI時(shí)代的數(shù)據(jù)治理新生態(tài)具有重要的制度指引意義:
其一,《辦法》明確了生成式人工智能服務(wù)中的數(shù)據(jù)治理要求。《辦法》規(guī)定提供和使用生成式人工智能服務(wù),應(yīng)當(dāng)遵守法律、行政法規(guī),尊重社會(huì)公德和倫理道德,明確了新技術(shù)場景下數(shù)據(jù)新治理的價(jià)值底蘊(yùn)。同時(shí),《辦法》要求在算法設(shè)計(jì)、訓(xùn)練數(shù)據(jù)選擇、模型生成和優(yōu)化、提供服務(wù)等過程中,采取有效措施防止民族、信仰、國別、地域、性別、年齡、職業(yè)、健康等歧視,強(qiáng)調(diào)在數(shù)據(jù)治理中防止偏見和歧視,并為生成式人工智能服務(wù)的可持續(xù)發(fā)展提供價(jià)值保障。
其二,《辦法》強(qiáng)調(diào)了生成式人工智能服務(wù)中數(shù)據(jù)處理的特別要求。一方面,《辦法》就相關(guān)數(shù)據(jù)處理活動(dòng)規(guī)定了明晰的行為規(guī)則,生成式人工智能服務(wù)提供者在依法開展預(yù)訓(xùn)練、優(yōu)化訓(xùn)練等訓(xùn)練數(shù)據(jù)處理活動(dòng)中,一是應(yīng)當(dāng)使用具有合法來源的數(shù)據(jù)和基礎(chǔ)模型;二是涉及個(gè)人信息的,應(yīng)當(dāng)取得個(gè)人同意或者符合法律、行政法規(guī)規(guī)定的其他情形;三是采取有效措施提高訓(xùn)練數(shù)據(jù)質(zhì)量,增強(qiáng)訓(xùn)練數(shù)據(jù)的真實(shí)性、準(zhǔn)確性、客觀性、多樣性。
另一方面,《辦法》就相關(guān)數(shù)據(jù)標(biāo)注活動(dòng)設(shè)定了專門的業(yè)務(wù)規(guī)則,規(guī)定在生成式人工智能技術(shù)研發(fā)過程中進(jìn)行數(shù)據(jù)標(biāo)注的,提供者應(yīng)當(dāng)制定符合辦法要求的清晰、具體、可操作的標(biāo)注規(guī)則;開展數(shù)據(jù)標(biāo)注質(zhì)量評估,抽樣核驗(yàn)標(biāo)注內(nèi)容的準(zhǔn)確性;對標(biāo)注人員進(jìn)行必要培訓(xùn),提升尊法守法意識(shí),監(jiān)督指導(dǎo)標(biāo)注人員規(guī)范開展標(biāo)注工作?!掇k法》關(guān)于標(biāo)注規(guī)則、質(zhì)量評估和人員培訓(xùn)的組合要求有益于數(shù)據(jù)資源的理解與利用,進(jìn)而提高相關(guān)數(shù)據(jù)處理的準(zhǔn)確性及其效能。
其三,《辦法》突出了生成式人工智能服務(wù)中數(shù)據(jù)生態(tài)的多方協(xié)同。《辦法》一是強(qiáng)調(diào)支持行業(yè)組織、企業(yè)、教育和科研機(jī)構(gòu)、公共文化機(jī)構(gòu)、有關(guān)專業(yè)機(jī)構(gòu)等在生成式人工智能技術(shù)創(chuàng)新、數(shù)據(jù)資源建設(shè)、轉(zhuǎn)化應(yīng)用、風(fēng)險(xiǎn)防范等方面開展協(xié)作,旨在最大程度激發(fā)各方主體的積極性和參與度,提升共建共治共享的數(shù)據(jù)生態(tài)水平。二是強(qiáng)調(diào)推動(dòng)生成式人工智能基礎(chǔ)設(shè)施和公共訓(xùn)練數(shù)據(jù)資源平臺(tái)建設(shè),促進(jìn)算力資源協(xié)同共享,提升算力資源利用效能,推動(dòng)公共數(shù)據(jù)分類分級有序開放,擴(kuò)展高質(zhì)量的公共訓(xùn)練數(shù)據(jù)資源,鼓勵(lì)采用安全可信的芯片、軟件、工具、算力和數(shù)據(jù)資源。從基礎(chǔ)設(shè)施到平臺(tái)建設(shè),從算力資源到公共數(shù)據(jù),《辦法》的規(guī)范設(shè)計(jì)有利于形成多方參與、安全可信的高質(zhì)量數(shù)據(jù)生態(tài)。
作者:吳沈括 北京師范大學(xué)法學(xué)院博士生導(dǎo)師、中國互聯(lián)網(wǎng)協(xié)會(huì)研究中心副主任
本文轉(zhuǎn)載自:安徽省網(wǎng)信辦,原文鏈接:http://www.ahwx.gov.cn/wlyj/202308/t20230829_7048034.html