關(guān)于發(fā)展生成式人工智能 加強(qiáng)出版業(yè)前沿技術(shù)應(yīng)用的提案
生成式人工智能技術(shù)在知識(shí)生產(chǎn)、信息獲取和人機(jī)交互方面取得了劃時(shí)代的突破,正在引發(fā)新一輪的科技革命和產(chǎn)業(yè)變革,不斷催生新產(chǎn)業(yè)、新業(yè)態(tài)和新商業(yè)模式,培育經(jīng)濟(jì)發(fā)展新動(dòng)能。生成式人工智能技術(shù)同時(shí)也給傳統(tǒng)出版業(yè)帶來(lái)了挑戰(zhàn)和發(fā)展機(jī)遇。2022年4月,中共中央宣傳部印發(fā)《關(guān)于推動(dòng)出版深度融合發(fā)展的實(shí)施意見(jiàn)》,指出要加強(qiáng)前沿技術(shù)探索應(yīng)用,“緊盯技術(shù)發(fā)展前沿,用好信息技術(shù)革命成果,強(qiáng)化大數(shù)據(jù)、云計(jì)算、人工智能、區(qū)塊鏈等技術(shù)應(yīng)用”。但是,生成式人工智能與出版業(yè)的融合發(fā)展仍面臨諸多現(xiàn)實(shí)問(wèn)題:
一是技術(shù)開(kāi)發(fā)與落地應(yīng)用存在困難。生成式人工智能大模型的三要素是數(shù)據(jù)、算力與算法。出版業(yè)普遍具有較高質(zhì)量的數(shù)據(jù)積累,根據(jù)國(guó)家新聞出版署發(fā)布的《2021年新聞出版產(chǎn)業(yè)分析報(bào)告》,2021年全國(guó)共出版圖書(shū)、期刊、報(bào)紙、音像制品和電子出版物426.65億冊(cè)(份、盒、張)。但是,出版業(yè)在算力方面存在嚴(yán)重不足,算法技術(shù)相對(duì)落后。人工智能大模型使用具有一定的門(mén)檻,如需要一定的基礎(chǔ)設(shè)施投入等,而出版業(yè)的單位體量通常較小,在一定程度上制約生成式人工智能的應(yīng)用。
二是生成內(nèi)容質(zhì)量不高,存在安全隱患。生成式人工智能基于概率產(chǎn)生內(nèi)容,經(jīng)常存在知識(shí)記憶錯(cuò)誤、信息時(shí)效性不足、邏輯推理錯(cuò)亂、專業(yè)知識(shí)缺乏等問(wèn)題。如果對(duì)大模型的訓(xùn)練數(shù)據(jù)管控不嚴(yán),很容易暴露敏感信息,甚至生成不符合社會(huì)主義核心價(jià)值觀的不當(dāng)內(nèi)容。
三是生成訓(xùn)練語(yǔ)料存在合規(guī)性問(wèn)題。生成式人工智能大模型訓(xùn)練需要海量高質(zhì)量語(yǔ)料數(shù)據(jù),但出版業(yè)缺少新聞出版數(shù)據(jù)應(yīng)用到大模型中的政策指導(dǎo)。大模型技術(shù)廠商有強(qiáng)烈的數(shù)據(jù)需求,希望利用新聞出版機(jī)構(gòu)的高質(zhì)量數(shù)據(jù)訓(xùn)練生成式人工智能大模型,但是,新聞出版機(jī)構(gòu)由于缺乏定價(jià)標(biāo)準(zhǔn)和收益分配規(guī)則,且擔(dān)心數(shù)據(jù)安全問(wèn)題,不敢與大模型技術(shù)廠商合作,導(dǎo)致出版機(jī)構(gòu)的高質(zhì)量語(yǔ)料數(shù)據(jù)難以高效流通,發(fā)揮數(shù)據(jù)要素價(jià)值。
為此,建議:
一是加強(qiáng)政策引導(dǎo)和扶持。加快推進(jìn)生成式人工智能在出版業(yè)的落地應(yīng)用,助力出版業(yè)向知識(shí)服務(wù)業(yè)轉(zhuǎn)型。充分考慮出版業(yè)發(fā)展特點(diǎn),遵循生成式人工智能服務(wù)管理相關(guān)文件要求,制定并完善適用于出版業(yè)的管理辦法,規(guī)范、促進(jìn)出版業(yè)人工智能大模型的訓(xùn)練和應(yīng)用。加強(qiáng)政策扶持,鼓勵(lì)創(chuàng)新探索,培育生態(tài)體系,營(yíng)造良好政策環(huán)境,促進(jìn)出版業(yè)與人工智能融合發(fā)展。支持行業(yè)組織、企業(yè)等在生成式人工智能技術(shù)創(chuàng)新、數(shù)據(jù)資源建設(shè)、轉(zhuǎn)化應(yīng)用、風(fēng)險(xiǎn)防范等方面開(kāi)展協(xié)作。設(shè)立扶持計(jì)劃或項(xiàng)目,推動(dòng)出版業(yè)生成式人工智能基礎(chǔ)設(shè)施和平臺(tái)建設(shè),促進(jìn)算力等資源協(xié)同共享。
二是建立行業(yè)準(zhǔn)入機(jī)制。為保障生成式人工智能技術(shù)的有序發(fā)展及相關(guān)出版融媒體產(chǎn)品堅(jiān)持正確政治方向、輿論導(dǎo)向、價(jià)值取向,建議加快制定出版業(yè)的人工智能大模型認(rèn)證準(zhǔn)入相關(guān)政策,從國(guó)家、行業(yè)層面制定人工智能相關(guān)技術(shù)產(chǎn)品的準(zhǔn)入門(mén)檻,包括相應(yīng)的認(rèn)證、備案、監(jiān)管等細(xì)則。同時(shí),為確保大模型訓(xùn)練結(jié)果的準(zhǔn)確性和可信度,建議制定相關(guān)工作指南,以確保訓(xùn)練過(guò)程的高效和結(jié)果的可靠性、安全性。
三是建立訓(xùn)練語(yǔ)料付酬標(biāo)準(zhǔn)。面對(duì)大模型訓(xùn)練數(shù)據(jù)中可能涉及的侵權(quán)問(wèn)題,除了規(guī)范數(shù)據(jù)合規(guī)使用外,監(jiān)管部門(mén)還應(yīng)著力推動(dòng)制定生成式人工智能訓(xùn)練語(yǔ)料的權(quán)益分配辦法,充分考慮多元利益相關(guān)主體的不同訴求,既激勵(lì)人工智能產(chǎn)業(yè)的創(chuàng)新發(fā)展,又能夠保障高質(zhì)量數(shù)據(jù)生產(chǎn)者的合法權(quán)益。