壓縮算法為大語言模型“瘦身”

2024-11-23 10:35:56來源：科技日?qǐng)?bào)

據(jù)美國(guó)科學(xué)促進(jìn)會(huì)旗下網(wǎng)站19日?qǐng)?bào)道，美國(guó)普林斯頓大學(xué)和斯坦福大學(xué)團(tuán)隊(duì)開發(fā)出一種新壓縮算法CALDERA，能精簡(jiǎn)大型語言模型（LLM）的海量數(shù)據(jù)，為L(zhǎng)LM“瘦身”。這項(xiàng)算法不僅有助保護(hù)數(shù)據(jù)隱私、節(jié)約能源、降低成本，還能推動(dòng)LLM在手機(jī)和筆記本電腦上高效使用。

團(tuán)隊(duì)舉例稱，當(dāng)人們使用ChatGPT時(shí)，請(qǐng)求會(huì)被發(fā)送到OpenAI公司的后端服務(wù)器進(jìn)行處理。這一過程不僅成本高昂、能耗巨大，通常還很慢。如果用戶想要使用消費(fèi)級(jí)圖形處理單元運(yùn)行LLM，就需要對(duì)這些LLM進(jìn)行壓縮。

CALDERA算法通過減少LLM冗余并降低信息層的精度來發(fā)揮作用。“瘦身”后的LLM更加精簡(jiǎn)，可在手機(jī)或筆記本電腦等設(shè)備上存儲(chǔ)和訪問，同時(shí)提供了與未壓縮版本幾乎一樣準(zhǔn)確而微妙的性能。

雖然CALDERA并非首個(gè)壓縮LLM的算法，但其獨(dú)特之處在于兼具“低精度”和“低排序”兩種特性。其中，“低精度”減少了比特?cái)?shù)，加快了數(shù)據(jù)存儲(chǔ)和處理速度。而“低排序”則降低了LLM數(shù)據(jù)中的冗余。

團(tuán)隊(duì)表示，使用CALDERA壓縮的LLM可能適用于那些對(duì)精度要求不是最高的場(chǎng)景。此外，用戶可在智能手機(jī)或筆記本電腦等設(shè)備上對(duì)壓縮后的LLM進(jìn)行微調(diào)，這使其能根據(jù)特定需求調(diào)整模型來增強(qiáng)隱私，而無需與第三方共享敏感數(shù)據(jù)。

不過團(tuán)隊(duì)也提醒道，在智能手機(jī)或筆記本電腦上運(yùn)行LLM，可能會(huì)占用設(shè)備內(nèi)存。

標(biāo)簽：

責(zé)任編輯：

免責(zé)聲明

頭條新聞

人形機(jī)器人“CASBOT 01 ”亮相

11月12日，科研人員在位于北京的實(shí)驗(yàn)室調(diào)試人形機(jī)器人CASBOT 01。11月13日晚，人形機(jī)器人CASBOT 01在...
新華鮮報(bào)|海水有多咸？衛(wèi)星“望聞問切”來探測(cè)

海水有多咸？遠(yuǎn)在太空的衛(wèi)星來探測(cè)。11月14日清晨，太原衛(wèi)星發(fā)射中心，長(zhǎng)征四號(hào)乙遙五十三運(yùn)載火箭托舉...
小巧靈敏的核輻射劑量探測(cè)芯片成功量產(chǎn)

近日，由中核集團(tuán)原子能院核安全與環(huán)境工程技術(shù)研究所研發(fā)的國(guó)際首款X γ核輻射劑量探測(cè)芯片成功...
中國(guó)科學(xué)院第七屆科學(xué)節(jié)為公眾奉上科學(xué)“盛宴”

體驗(yàn)聲波懸浮空氣炮，了解高海拔宇宙線觀測(cè)站、愛因斯坦探針衛(wèi)星的最新發(fā)現(xiàn)，現(xiàn)場(chǎng)觀摩科學(xué)家的科研日常...

壓縮算法為大語言模型“瘦身”

免責(zé)聲明

頭條新聞

最新新聞

精華推薦

猜你喜歡

重磅推薦

精彩放送