難以破解的AI“黑匣子”

2024-10-30 11:15:57來源：科技日報

說到黑匣子，許多人會聯(lián)想到飛機上用于記錄飛行數(shù)據(jù)的設(shè)備或充滿懷舊氣息的小劇場。然而，在人工智能（AI）領(lǐng)域，黑匣子同樣是個不可忽視的重要術(shù)語。

西班牙《國家報》指出，當(dāng)AI神經(jīng)網(wǎng)絡(luò)運行時，即便是最資深的研究人員也對其內(nèi)部運作一無所知。這里討論的無關(guān)生物學(xué)，而是AI算法，特別是那些基于深度學(xué)習(xí)、模仿神經(jīng)元之間連接的算法。這些系統(tǒng)宛如黑匣子，數(shù)據(jù)科學(xué)家、學(xué)術(shù)界頂尖人才，以及榮獲諾貝爾獎的OpenAI和谷歌的工程師們，也難以窺探其內(nèi)部奧秘。

圖片來源：西班牙《國家報》網(wǎng)站

模型與數(shù)據(jù)具有不透明性

《科學(xué)美國人》雜志報道稱，AI黑匣子指的是內(nèi)部運作方式對用戶完全不可見的AI系統(tǒng)。用戶可以向這些系統(tǒng)輸入信息并獲得輸出，但無法檢查其代碼或了解產(chǎn)生輸出的邏輯。

機器學(xué)習(xí)作為AI的主要分支，是ChatGPT等生成式AI系統(tǒng)的基石。機器學(xué)習(xí)包含算法、訓(xùn)練數(shù)據(jù)和模型3個核心部分。算法是一系列程序指令，在機器學(xué)習(xí)中，算法通過大量訓(xùn)練數(shù)據(jù)，學(xué)會識別數(shù)據(jù)中的模式。當(dāng)機器學(xué)習(xí)算法完成訓(xùn)練，其產(chǎn)物便是機器學(xué)習(xí)模型，這也是用戶實際使用的部分。

機器學(xué)習(xí)系統(tǒng)這3個部分中，任何一個都可能被隱藏起來，即被置于黑匣子中。通常情況下，算法是公開的。但為了保護知識產(chǎn)權(quán)，AI軟件開發(fā)者通常會將模型或訓(xùn)練數(shù)據(jù)放進黑匣子。

模型架構(gòu)復(fù)雜到難以解釋

盡管許多AI算法背后的數(shù)學(xué)原理已被人們充分理解，但由這些算法構(gòu)成的網(wǎng)絡(luò)所產(chǎn)生的行為，卻難以捉摸。

ChatGPT、Gemini、Claude、Llama以及任何如DALL-E這樣的圖像生成器，以及任何依賴神經(jīng)網(wǎng)絡(luò)的系統(tǒng)，包括面部識別應(yīng)用和內(nèi)容推薦引擎，都面臨這樣的問題。

相比之下，其他AI算法，如決策樹或線性回歸（常用于醫(yī)學(xué)和經(jīng)濟等領(lǐng)域），則更具可解釋性。它們的決策過程易于理解和可視化。工程師可順著決策樹的分支，清晰地看到特定結(jié)果是如何得出的。

這種清晰性至關(guān)重要，因為它為AI注入了透明度，并向算法的使用者提供了安全保障。值得注意的是，歐盟《人工智能法案》強調(diào)了擁有透明且可解釋系統(tǒng)的重要性。然而，神經(jīng)網(wǎng)絡(luò)本身的架構(gòu)卻阻礙了這種透明性。要理解這些算法的黑匣子問題，人們必須想象一個由相互連接的神經(jīng)元或節(jié)點構(gòu)成的網(wǎng)絡(luò)。

西班牙國家研究委員會AI研究所教授胡安·安東尼奧解釋道，當(dāng)你把數(shù)據(jù)輸入網(wǎng)絡(luò)，節(jié)點中的值會觸發(fā)一系列計算。信息從第一批節(jié)點開始傳播，以數(shù)值形式傳遞到后續(xù)節(jié)點，每個節(jié)點都會計算一個數(shù)字，并將其發(fā)送到所有連接，同時考慮每個連接的權(quán)重（即數(shù)值）。接收到這些信息的新節(jié)點會再計算另一個數(shù)字。

值得注意的是，當(dāng)前深度學(xué)習(xí)模型包含數(shù)千到數(shù)百萬個參數(shù)。這些參數(shù)代表了訓(xùn)練后的節(jié)點和連接數(shù)量，數(shù)量龐大且變化多端，因此很難手動得出有意義的方程。

據(jù)業(yè)內(nèi)人士估計，GPT-4擁有近1.8萬億個參數(shù)。根據(jù)這一分析，每個語言模型將使用約2200億個參數(shù)。這意味著，每當(dāng)提出一個問題時，就有2200億個變量可能影響算法的回應(yīng)。

科技公司嘗試打開黑匣子

系統(tǒng)不透明性讓糾正偏見變得更難，也加劇了不信任感。目前，AI領(lǐng)域的主要參與者意識到了這一局限性，并正在積極開展研究，以更好地了解其模型的工作原理。例如，OpenAI用神經(jīng)網(wǎng)絡(luò)觀察分析另一神經(jīng)網(wǎng)絡(luò)，Anthropic研究節(jié)點連接和信息傳播電路等。

解碼黑匣子對語言模型大有裨益，能避免錯誤推理和AI產(chǎn)生誤導(dǎo)信息，解決答案不一致問題。然而，由于不了解網(wǎng)絡(luò)內(nèi)部機制，科技公司通常會讓模型進行大量訓(xùn)練，通過測試后即發(fā)布產(chǎn)品。這種方法也可能會存在問題，如谷歌Gemini在初發(fā)布時就生成了錯誤的圖像。

與黑匣子相對的一個概念是玻璃盒。AI玻璃盒是指它的算法、訓(xùn)練數(shù)據(jù)和模型都可以被任何人看到。解碼黑匣子的最終目標(biāo)是保持對AI的控制，特別是將其部署在敏感領(lǐng)域時。假設(shè)一個機器學(xué)習(xí)模型已經(jīng)對人類的健康狀況或財務(wù)狀況做出了診斷，人們會希望該模型是黑匣子還是玻璃盒呢？答案顯而易見。這不僅是對算法內(nèi)部工作原理的高度關(guān)注，也不僅是出于科學(xué)的好奇心，更有對用戶隱私的保護。

標(biāo)簽：

責(zé)任編輯：

免責(zé)聲明

頭條新聞

難以破解的AI“黑匣子”

說到黑匣子，許多人會聯(lián)想到飛機上用于記錄飛行數(shù)據(jù)的設(shè)備或充滿懷舊氣息的小劇場。然而，在人工智能（A...
神舟十九號航天員乘組確定

這是神舟十九號航天員蔡旭哲（中）、宋令東（右）、王浩澤。執(zhí)行神舟十九號載人飛行任務(wù)的航天員乘組由...
新時代中國調(diào)研行之看區(qū)域·西部篇｜科技創(chuàng)新引領(lǐng)西部高質(zhì)量發(fā)展

當(dāng)前，以科技創(chuàng)新推動產(chǎn)業(yè)創(chuàng)新成為新一輪西部大開發(fā)的重點。西部各省區(qū)市因地制宜探索和發(fā)揮科技創(chuàng)新的...
嚴(yán)二平：堅持長期主義，袋鼠媽媽用品質(zhì)贏得生意和品牌雙增長

&emsp;新華網(wǎng)北京10月29日電（谷雨）隨著消費者對護膚需求的日益細(xì)分化，青少年護膚市場正逐漸成為新的...

難以破解的AI“黑匣子”

免責(zé)聲明

頭條新聞

最新新聞

精華推薦

猜你喜歡

重磅推薦

精彩放送