專家解讀|構(gòu)建面向AI時代的數(shù)據(jù)治理新生態(tài)
發(fā)布日期:2023-10-18 瀏覽次數(shù):2086 發(fā)布者:
生成式人工智能技術(shù)作為具有文本、圖片、音頻、視頻等內(nèi)容生成能力的模型及相關(guān)技術(shù),正在世界范圍內(nèi)推動掀起一輪人工智能發(fā)展的新高潮。一方面,生成式人工智能帶來新的發(fā)展機遇,包括新的技術(shù)支持、新的業(yè)務類型和新的應用內(nèi)容;另一方面,生成式人工智能也伴生來源更為多樣、程度更為深刻的安全風險,涵蓋各類技術(shù)要素風險和數(shù)字內(nèi)容風險等。如何充分發(fā)揮生成式人工智能的價值潛能并有效實現(xiàn)其規(guī)范治理,已是各國共同關(guān)注的時代命題。
2023年7月13日,國家網(wǎng)信辦聯(lián)合國家發(fā)展改革委、教育部、科技部、工業(yè)和信息化部、公安部和廣電總局公布《生成式人工智能服務管理暫行辦法》(以下稱《辦法》),自2023年8月15日起施行?!掇k法》作為全球第一部關(guān)于生成式人工智能治理的專門法律規(guī)范,具有重大意義。
《辦法》的謀篇布局堅持發(fā)展和安全并重的立法精神,規(guī)則的字里行間突出高質(zhì)量發(fā)展新階段語境下綜合治理的生態(tài)理念,是促進生成式人工智能技術(shù)健康發(fā)展和規(guī)范應用的有力舉措。
一方面,《辦法》的條文設(shè)計在數(shù)據(jù)治理、算法設(shè)計、內(nèi)容管理、虛假信息防范以及權(quán)益保護等多個層面,圍繞生成式人工智能服務劃定了全方位的合規(guī)要求;另一方面,《辦法》強調(diào)與《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》《個人信息保護法》《科學技術(shù)進步法》等上位法律,以及《互聯(lián)網(wǎng)信息服務算法推薦管理規(guī)定》《互聯(lián)網(wǎng)信息服務深度合成管理規(guī)定》等現(xiàn)行規(guī)范構(gòu)成的治理框架緊密銜接,形成關(guān)于生成式人工智能服務的立體規(guī)則體系。
從系統(tǒng)治理論的角度,可以認為生成式人工智能的三大核心要素包括數(shù)據(jù)、算力和算法:海量數(shù)據(jù)被認為是生成式人工智能的基石,充沛算力是生成式人工智能的基礎(chǔ)能力支撐,先進算法是生成式人工智能的基本實現(xiàn)途徑。應當指出的是,《辦法》的各項制度規(guī)范深刻洞察生成式人工智能的技術(shù)原理及其運行邏輯,特別是在《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》《個人信息保護法》等法律、行政法規(guī)的基礎(chǔ)上,著眼生成式人工智能服務語境下的數(shù)據(jù)治理,引入了多項專門規(guī)范,對于構(gòu)建面向AI時代的數(shù)據(jù)治理新生態(tài)具有重要的制度指引意義:
其一,《辦法》明確了生成式人工智能服務中的數(shù)據(jù)治理要求。《辦法》規(guī)定提供和使用生成式人工智能服務,應當遵守法律、行政法規(guī),尊重社會公德和倫理道德,明確了新技術(shù)場景下數(shù)據(jù)新治理的價值底蘊。同時,《辦法》要求在算法設(shè)計、訓練數(shù)據(jù)選擇、模型生成和優(yōu)化、提供服務等過程中,采取有效措施防止民族、信仰、國別、地域、性別、年齡、職業(yè)、健康等歧視,強調(diào)在數(shù)據(jù)治理中防止偏見和歧視,并為生成式人工智能服務的可持續(xù)發(fā)展提供價值保障。
其二,《辦法》強調(diào)了生成式人工智能服務中數(shù)據(jù)處理的特別要求。一方面,《辦法》就相關(guān)數(shù)據(jù)處理活動規(guī)定了明晰的行為規(guī)則,生成式人工智能服務提供者在依法開展預訓練、優(yōu)化訓練等訓練數(shù)據(jù)處理活動中,一是應當使用具有合法來源的數(shù)據(jù)和基礎(chǔ)模型;二是涉及個人信息的,應當取得個人同意或者符合法律、行政法規(guī)規(guī)定的其他情形;三是采取有效措施提高訓練數(shù)據(jù)質(zhì)量,增強訓練數(shù)據(jù)的真實性、準確性、客觀性、多樣性。
另一方面,《辦法》就相關(guān)數(shù)據(jù)標注活動設(shè)定了專門的業(yè)務規(guī)則,規(guī)定在生成式人工智能技術(shù)研發(fā)過程中進行數(shù)據(jù)標注的,提供者應當制定符合辦法要求的清晰、具體、可操作的標注規(guī)則;開展數(shù)據(jù)標注質(zhì)量評估,抽樣核驗標注內(nèi)容的準確性;對標注人員進行必要培訓,提升尊法守法意識,監(jiān)督指導標注人員規(guī)范開展標注工作?!掇k法》關(guān)于標注規(guī)則、質(zhì)量評估和人員培訓的組合要求有益于數(shù)據(jù)資源的理解與利用,進而提高相關(guān)數(shù)據(jù)處理的準確性及其效能。
其三,《辦法》突出了生成式人工智能服務中數(shù)據(jù)生態(tài)的多方協(xié)同。《辦法》一是強調(diào)支持行業(yè)組織、企業(yè)、教育和科研機構(gòu)、公共文化機構(gòu)、有關(guān)專業(yè)機構(gòu)等在生成式人工智能技術(shù)創(chuàng)新、數(shù)據(jù)資源建設(shè)、轉(zhuǎn)化應用、風險防范等方面開展協(xié)作,旨在最大程度激發(fā)各方主體的積極性和參與度,提升共建共治共享的數(shù)據(jù)生態(tài)水平。二是強調(diào)推動生成式人工智能基礎(chǔ)設(shè)施和公共訓練數(shù)據(jù)資源平臺建設(shè),促進算力資源協(xié)同共享,提升算力資源利用效能,推動公共數(shù)據(jù)分類分級有序開放,擴展高質(zhì)量的公共訓練數(shù)據(jù)資源,鼓勵采用安全可信的芯片、軟件、工具、算力和數(shù)據(jù)資源。從基礎(chǔ)設(shè)施到平臺建設(shè),從算力資源到公共數(shù)據(jù),《辦法》的規(guī)范設(shè)計有利于形成多方參與、安全可信的高質(zhì)量數(shù)據(jù)生態(tài)。
作者:吳沈括 北京師范大學法學院博士生導師、中國互聯(lián)網(wǎng)協(xié)會研究中心副主任
本文轉(zhuǎn)載自:安徽省網(wǎng)信辦,原文鏈接:http://www.ahwx.gov.cn/wlyj/202308/t20230829_7048034.html