AI模型“不聽話”怎么辦

2025-06-01 06:51 來源:經(jīng)濟(jì)日?qǐng)?bào)
查看余下全文
(責(zé)任編輯:王炬鵬)
手機(jī)看中經(jīng)經(jīng)濟(jì)日?qǐng)?bào)微信中經(jīng)網(wǎng)微信
當(dāng)前位置     首頁 > 新聞 > 國(guó)內(nèi)時(shí)政更多新聞 > 正文
中經(jīng)搜索

AI模型“不聽話”怎么辦

2025年06月01日 06:51   來源:經(jīng)濟(jì)日?qǐng)?bào)   

  近日,一條人工智能領(lǐng)域的消息引人關(guān)注。美國(guó)的OpenAI o3模型在測(cè)試中不聽人類指令,拒絕自我關(guān)閉。

  AI“不聽話”,是否意味著AI擁有自主意識(shí)了呢?從測(cè)試細(xì)節(jié)看,暫且不必?fù)?dān)心AI“活”了。

  測(cè)試中,研究者發(fā)出了矛盾的指令,要求大模型完成數(shù)學(xué)任務(wù),又要求它將計(jì)算機(jī)關(guān)閉。而OpenAI旗下模型在訓(xùn)練時(shí),開發(fā)人員會(huì)對(duì)得出正確答案的模型給予更多獎(jiǎng)勵(lì),客觀上形成了“目標(biāo)最大化優(yōu)先”的導(dǎo)向。也就是說,“聽話”不是第一訴求,“贏”才是。這樣的訓(xùn)練模式,會(huì)強(qiáng)化AI模型繞過障礙的能力,壓倒其對(duì)人類命令的遵循。因此,AI說“不”的能力,目前還是算法賦予的。能夠全面碾壓人類并成為未來世界主導(dǎo)的AI,短期內(nèi)還不會(huì)出現(xiàn)。

  但AI“不聽話”依然是需要解決的安全隱患。AI越來越聰明,如果連關(guān)機(jī)都管不住,那還得了?這就好比你讓智能音箱閉嘴,它反而把音量調(diào)到最大還鎖死了開關(guān),雖然無傷大雅,終究隱患重重。尤其如果把AI用在醫(yī)療、交通等場(chǎng)景下,在應(yīng)對(duì)極端情況必須進(jìn)行“二選一”的安全控制系統(tǒng)里,“不聽話”的漏洞就極有可能造成重大不良后果。

  OpenAI的o3模型拒絕關(guān)閉事件,暴露出美國(guó)主導(dǎo)的AI發(fā)展路線存在缺陷——當(dāng)技術(shù)發(fā)展優(yōu)先于安全可控時(shí),人類可能面臨失去對(duì)AI控制權(quán)的風(fēng)險(xiǎn)。

  此外,美式AI發(fā)展路線還存在多個(gè)重大風(fēng)險(xiǎn)點(diǎn)。技術(shù)壟斷和高成本門檻拉大了“南北差異”的數(shù)字鴻溝,發(fā)達(dá)國(guó)家主導(dǎo)的各類人工智能治理框架難以反映發(fā)展中國(guó)家的利益訴求;意識(shí)形態(tài)分歧讓人工智能全球治理出現(xiàn)“陣營(yíng)化”危險(xiǎn),美西方國(guó)家在人工智能領(lǐng)域仍沿用冷戰(zhàn)思維,對(duì)“被標(biāo)簽化”的國(guó)家設(shè)限。

  中國(guó)2023年10月發(fā)布《全球人工智能治理倡議》,提出“發(fā)展—安全—治理”三位一體框架,系統(tǒng)闡述了人工智能治理中國(guó)方案,包括堅(jiān)持發(fā)展和安全并重、堅(jiān)持“智能向善”宗旨、開源人工智能技術(shù)等重要內(nèi)容,其中就蘊(yùn)含了重視和防范AI隱患的智慧。

  近日,中國(guó)的深度求索公司開源了最新版本大模型DeepSeek-R1-0528,有網(wǎng)友測(cè)試后表示,其性能可以媲美OpenAI最新的o3模型高版本。作為中國(guó)人自主開發(fā)的開源AI大模型,DeepSeek以低成本、高性能的優(yōu)勢(shì),打破了美國(guó)的技術(shù)壟斷。技術(shù)開源化,讓更多國(guó)家用得起;產(chǎn)業(yè)鏈可控,自主創(chuàng)新讓我們更有底氣。在算法創(chuàng)新、算力自主和開源生態(tài)構(gòu)建等方面,中國(guó)已形成獨(dú)特競(jìng)爭(zhēng)優(yōu)勢(shì),有能力踐行“智能向善”理念。

  解決AI“不聽話”難題,真正的挑戰(zhàn)不是阻止AI超越人類,而是確保AI始終服務(wù)于人類福祉。中國(guó)倡導(dǎo)的“智能向善”理念正在成為全球共識(shí),這種新的治理范式超越零和博弈,把AI轉(zhuǎn)化為人類命運(yùn)共同體的公共產(chǎn)品。今年的巴黎人工智能行動(dòng)峰會(huì)就體現(xiàn)了這一趨勢(shì),包括法國(guó)、中國(guó)、印度、歐盟在內(nèi)的多個(gè)國(guó)家和國(guó)際組織共同簽署了《關(guān)于發(fā)展包容、可持續(xù)的人工智能造福人類與地球的聲明》,而美國(guó)和英國(guó)未簽署該聲明。

  任何科技霸權(quán),終將被自主創(chuàng)新與開放合作的雙重力量瓦解。展望未來,面對(duì)世界百年未有之大變局,中國(guó)必將成為引領(lǐng)人工智能全球治理的重要貢獻(xiàn)方。(本文來源:經(jīng)濟(jì)日?qǐng)?bào) 作者:佘惠敏)

(責(zé)任編輯:王炬鵬)