展會信息港展會大全

英特爾開源 NPU 加速庫,方便使開發(fā)人員優(yōu)化其 AI 應(yīng)用
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-03-04 14:53:49   瀏覽:4346次  

導(dǎo)讀:IT之家 3 月 3 日消息,@Tony Mongkolsmai 發(fā)現(xiàn),英特爾已經(jīng)在 GitHub 上開源了其 NPU 加速庫,支持 Windows 和 Linux。 開發(fā)人員可以按照相應(yīng)文檔對其軟件進(jìn)行優(yōu)化,從而適配新一代 AI 模型,包括TinyLlama 和 Gemma-2b-it。 根據(jù)官方描述:英特爾 NPU 加速...

IT之家 3 月 3 日消息,@Tony Mongkolsmai 發(fā)現(xiàn),英特爾已經(jīng)在 GitHub 上開源了其 NPU 加速庫,支持 Windows 和 Linux。

開發(fā)人員可以按照相應(yīng)文檔對其軟件進(jìn)行優(yōu)化,從而適配新一代 AI 模型,包括TinyLlama 和 Gemma-2b-it。

英特爾開源 NPU 加速庫,方便使開發(fā)人員優(yōu)化其 AI 應(yīng)用

根據(jù)官方描述:英特爾 NPU 加速庫是一個(gè) Python 庫,旨在利用英特爾神經(jīng)處理單元 (NPU) 的強(qiáng)大性能在兼容硬件上執(zhí)行高速計(jì)算,從而提高應(yīng)用的效率。

英特爾還表示其 NPU 加速庫目前不斷開發(fā)中,后續(xù)將推出各種能顯著提高性能的功能,截至IT之家發(fā)稿已經(jīng)實(shí)現(xiàn)了 8bit 量化、Float16 支持、torch.compile 支持等,后續(xù)還將支持 NPU / GPU 異構(gòu)計(jì)算等功能。

英特爾開源 NPU 加速庫,方便使開發(fā)人員優(yōu)化其 AI 應(yīng)用

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港