a级毛毛片_亚洲99_魔兽1~6集在线观看_黑白配在线观看_天天操日日操_四虎免费网站

首頁 > 創(chuàng)作內(nèi)容 > 創(chuàng)作內(nèi)容 > 微軟亞研院多項(xiàng)創(chuàng)新技術(shù),彌合大模型低比特量化與終端部署間鴻溝

微軟亞研院多項(xiàng)創(chuàng)新技術(shù),彌合大模型低比特量化與終端部署間鴻溝

發(fā)布時(shí)間:2024-08-21 22:59:04

在人工智能領(lǐng)域,模型參數(shù)的增多往往意味著性能的提升。但隨著模型規(guī)模的擴(kuò)大,其對終端設(shè)備的算力與內(nèi)存需求也日益增加。低比特量化技術(shù),由于可以大幅降低存儲和計(jì)算成本并提升推理效率,已成為實(shí)現(xiàn)大模型在資源受限設(shè)備上高效運(yùn)行的關(guān)鍵技術(shù)之一。然而,如果硬件設(shè)備不支持低比特量化后的數(shù)據(jù)模式,那么低比特量化的優(yōu)勢將無法發(fā)揮。

為了解決這一問題,微軟亞洲研究院推出了全新的數(shù)據(jù)編譯器 Ladder 和算法 T-MAC,使當(dāng)前只支持對稱精度計(jì)算的硬件能夠直接運(yùn)行混合精度矩陣乘法。測試結(jié)果表明,Ladder 在支持 GPU 原本不支持的自定義數(shù)據(jù)類型方面,最高提速可達(dá)14.6倍;T-MAC 在搭載了最新高通 Snapdragon X Elite 芯片組的 Surface AI PC 上,使 CPU 上運(yùn)行的大模型吞吐率比專用加速器 NPU 快兩倍。此外,研究員們還設(shè)計(jì)了 LUT Tensor Core 硬件架構(gòu),這種精簡設(shè)計(jì)使硬件能夠直接支持各種低比特混合精度計(jì)算,為人工智能硬件設(shè)計(jì)提供了新思路。

 

大模型已經(jīng)越來越多地被部署在智能手機(jī)、筆記本電腦、機(jī)器人等端側(cè)設(shè)備上,以提供先進(jìn)的智能及實(shí)時(shí)響應(yīng)服務(wù)。但包含上億參數(shù)的大模型對終端設(shè)備的內(nèi)存和計(jì)算能力提出了極高的要求,也因此限制了它們的廣泛應(yīng)用。低比特量化技術(shù)因其能顯著壓縮模型規(guī)模,降低對計(jì)算資源的需求,成為了大模型在端側(cè)部署和實(shí)現(xiàn)高效推理的有效手段。

 

隨著低比特量化技術(shù)的發(fā)展,數(shù)據(jù)類型日益多樣化,如 int4、int2、int1 等低比特?cái)?shù)據(jù),使得大模型在推理中越來越多地采用低比特權(quán)重和高比特權(quán)重計(jì)算的混合精度矩陣乘法(mixed-precision matrix multiplication,mpGEMM)。然而,現(xiàn)有的 CPU、GPU 等硬件計(jì)算單元通常只支持對稱計(jì)算模式,并不兼容這種混合精度的矩陣乘法。

 

混合精度矩陣乘法與傳統(tǒng)的矩陣乘法有何不同?

 

在傳統(tǒng)的矩陣乘法中,參與運(yùn)算的兩端數(shù)值是對稱的,例如 FP16*FP16、int8*int8。但大模型的低比特量化打破了這種對稱性,使乘法的一端是高比特,另一端是低比特,例如在 1-bit 的 BitNet 模型中實(shí)現(xiàn)的 int8*int1 或 int8*int2,以及浮點(diǎn)數(shù)與整數(shù)的混合乘法 FP16*int4。

 

為了充分發(fā)揮低比特量化的優(yōu)勢,讓硬件設(shè)備能夠直接支持混合精度矩陣乘法,確保大模型在端側(cè)設(shè)備上的高速有效運(yùn)行,微軟亞洲研究院的研究員們針對現(xiàn)有 CPU、GPU 計(jì)算算子和硬件架構(gòu)進(jìn)行創(chuàng)新:

 

  • 推出了數(shù)據(jù)類型編譯器 Ladder,支持各種低精度數(shù)據(jù)類型的表達(dá)和相互轉(zhuǎn)換,將硬件不支持的數(shù)據(jù)類型無損轉(zhuǎn)換為硬件支持的數(shù)據(jù)類型指令,在傳統(tǒng)計(jì)算模式下,使得硬件能夠支持混合精度的 DNN(深度神經(jīng)網(wǎng)絡(luò))計(jì)算;
  • 研發(fā)了全新算法 T-MAC,基于查找表(Lookup Table,LUT)的方法,實(shí)現(xiàn)了硬件對混合精度矩陣乘法的直接支持,軟件層面,在 CPU 上的計(jì)算相比傳統(tǒng)計(jì)算模式取得了更好的加速;
  • 提出了新的硬件架構(gòu) LUT Tensor Core,為下一代人工智能硬件設(shè)計(jì)打開了新思路。

 

創(chuàng)作內(nèi)容更多>>

小米17系列全球發(fā)布會(huì)定檔:2月28日巴塞羅那見 Gemini 3.1:小小小小更新壓過對手大迭代,Google卷飛了 2026年2月小米17怎么選:一文看懂小米17系列的全部賣點(diǎn) 游戲一打開就讓你小心癲癇 真的有必要嗎? 特斯拉:xAI Grok將上線歐洲市場,率先在9國推出 印度、愛爾蘭成為最新有意設(shè)置社交媒體年齡限制的國家 OpenAI有望拿到1000億美元,但也快被逼到墻角了 消息稱Meta重啟智能手表項(xiàng)目,“Malibu 2”機(jī)型今年內(nèi)發(fā)布 五菱星光560上市,燃油/插混/純電可選,6萬級擁有15萬級享受 元UP冠軍續(xù)航401km 7萬級越級純電SUV 上年銷量21萬輛,2026北京現(xiàn)代直指“智啟2030計(jì)劃” 深耕者勝,長期者贏,smart的長期主義如何驅(qū)動(dòng)“確定性增長”? 首發(fā)天璣AIOS 6.0 ,2026小鵬新品發(fā)布會(huì)上市多款新車 為高原注入綠色動(dòng)能:宇通重工三電技術(shù)破解高原寒區(qū)作業(yè)困局 2025年中國乘用車銷量首破3000萬輛,今年預(yù)計(jì)增幅0.5% 本田官宣換標(biāo) 新LOGO 2027年全面啟用 李斌新年首次內(nèi)部講話:成立“人工智能技術(shù)委員會(huì)”,加大投入推動(dòng)AI全業(yè)務(wù)鏈落地 雷軍強(qiáng)調(diào):新一代SU7所有信息以工信部官網(wǎng)公告、正式發(fā)布會(huì)為準(zhǔn) 全球首個(gè)機(jī)器人租賃平臺“擎天租”完成種子輪融資 眾擎CEO:我們的T800機(jī)器人體能超90%正常男人 西貝閉店約4000名員工或?qū)⑹I(yè) 網(wǎng)友:羅永浩一句話影響這么大 上汽集團(tuán):2025年整車批發(fā)銷量超450萬輛 凈利同比預(yù)增438%-558% AI在美國“與民爭電”,核電成了硅谷“全村的希望” 16億只是保底,馬斯克想給朱曉彤的是100億 花旗:預(yù)計(jì)人民幣兌美元在未來6-12個(gè)月內(nèi)將升向6.8 片酬倍增、代言不斷,2025短劇演員能年入千萬?丨年終策劃 2026,房地產(chǎn)罕見“猛藥”來了! 機(jī)構(gòu):2025年北京甲級寫字樓凈吸納33萬平米,中關(guān)村占半數(shù) 2025年房企銷售額排位賽出爐:前十門檻卡線千億,誰進(jìn)誰退? 新年樓市積極開局:北京新政效果初顯,深圳元旦假期二手房簽約量同比漲四成
主站蜘蛛池模板: 日批视频在线 | 午夜无遮挡 | 先锋影音色 | 久久国产精品偷 | 国产精品免费一区二区三区都可以 | 亚洲欧美日韩综合 | jizz黄色片| 久久久国产精品人人片 | 中文字幕日韩三级 | 日韩毛片在线观看 | 成年人黄色网址 | 97国产在线 | 国产91传媒 | 国产精品8 | 在线看福利影 | 日韩第五页 | 日本美女爱爱视频 | 黄色一级图片 | 亚洲20p| 久久dvd| 日韩免费视频 | 久久大陆| 91久久久久久久久久 | 可以免费看黄色的网站 | 性感毛片 | 国产一区二区三区久久久 | 国产午夜精品一区二区 | av导航在线| 手机在线精品视频 | 日韩国产在线观看 | 日韩欧美成人一区二区三区 | 日本一区二区三区精品视频 | 国产在线观看www | 亚洲午夜久久久 | 午夜日韩视频 | 四虎成人影视 | 伊人久久久久久久久久久久 | 在线观看污视频 | 午夜a级片| 永久免费网站视频在线观看 | 九一毛片 |