高CP耳機開箱便宜吃到飽吉伊卡哇來台行充失火怎麼辦小S貼圖智慧眼鏡

18+

NVIDIA以TensorRT-LLM模型提高H100 GPU上的大型自然語言模型推論能力

2023-09-12 09:30

聯合新聞網／ 楊又肇

針對目前多數業者採用的大型自然語言模型應用需求，NVIDIA 宣布以開源架構設計的TensorRT-LLM模型，強化H100 GPU在大型自然語言模型的推論能力。

此項開源架構設計的TensorRT-LLM模型將在未來幾周內提供，本身以TensorRT深度學習框架組成，包括經最佳化調整的內核、前處理及後處理步驟，加上多組GPU、多節點通訊基礎，可在NVIDIA GPU上提供出突破性的效能表現。

除了能讓開發人員以更快速度運作大型自然語言模型，並且提供峰值效能和快速自訂功能，甚至無需具備深厚的C++或NVIDIA CUDA程式相關知識也能快速使用。

另外，TensorRT-LLM本身結合開源模組Python API，同時提高易用性與擴充性，可用於定義、最佳化和執行新架構，更可隨著大型自然語言模型發展擴充，並且能自訂相關內容。

相比Meta提出、參數達700億組的Llama 2，NVIDIA表示TensorRT-LLM配合H100 GPU，在Llama 2模型上推論效能，是使用A100 GPU的4.6倍。

TensorRT-LLM採用模型平行化 (model parallelism)的張力平行運算模式，將個別權重矩陣分割至各個裝置上，並且透過NVLink串接多組GPU，即可以大規模高效率的方式進行推論，進而加快大型自然語言模型運作效率。

同時，針對人工智慧 服務應用經常面臨一來一往的問答互動，或是藉由前後互動模式自動生成更多內容的情況，TensorRT-LLM可透過動態批次處理技術，立即從已經完成運算請求銜接下一個互動需求，無須等到所有運算逐一執行完畢才能銜接後續互動，藉此提高GPU加速運算使用率，在加快處理效率之餘，也降低更多等待處理時的電力損耗，以及相關運算使用成本。

另外，TensorRT-LLM搭配H100 GPU，即可將模型轉會為FP8格式，透過更低精度對應執行更大模型規模，並且能在不降低整體模型精度情況下，減少記憶體損耗，同時也能以更快效率執行運作。

目前NVIDUA將開放TensorRT-LLM前期測試，未來將整合進NVIDIA NeMo框架。而開發人員與研究人員目前可透過NGC上的NeMo框架，或是GitHub上的源碼庫取得TensorRT-LLM。

《原文刊登於合作媒體mashdigi，聯合新聞網獲授權轉載。》

📌 數位新聞搶鮮看！

　訂閱《科技玩家》YouTube頻道！
💡 追新聞》》在Google News按下追蹤，科技玩家好文不漏接！
📢 便宜資費懶人包／5G 399元搶市！不限速吃到飽方案比4G划算
📢 CMF Headphone Pro耳罩式耳機開箱！實測動感滑桿聽見動ㄘ動、驚豔降噪高CP
📢 坐飛機遇行充自燃怎麼辦？專家曝溫度控制就用它：亂用1物會更慘
📢 iPhone鬧鐘「沒響」錯過航班！網紅抱怨引出一票苦主 2招避免中招
📢 HTC VIVE Eagle智慧眼鏡開箱！日本實測AI翻譯菜單聽音樂驚豔、拍出日系照片
📢 懶人包／台灣吉伊卡哇常設店12月27日開幕！13樣新品、贈品、地點一次看

張勇不僅卸下阿里巴巴集團執行長身分更全面退出集團管理層

改變人類簡報方式！PowerPoint之父病逝享壽76歲

手機特價優惠當聖誕禮物！三星摺疊機省1萬2、iPhone 17 Pro Max砍近3千元

蘋果摺疊機iPhone Fold明年登場恐重演iPhone X現象！「真正買到時間」在這時

耶誕交換禮物看這邊！小米手環千元有找、旗艦手機最高砍1.4萬超優惠

人工智慧 Llama NVIDIA

BALENCIAGA全新Monaco摺疊鍊帶包夾、拎、斜揹都喜歡

《勝利女神：妮姬》尼爾地圖有紳士「觀景」秘境！放大SD模型橫看成嶺側成峰

考據最嚴謹！台南400重建17世紀「熱蘭遮城」生活模型首公開

台積電看好 AI 掀起 CPU、GPU 需求未來 CAGR 上看50％

AI時代示警…別再做「五年職涯規畫」！短期技能迭代才是王道

Google助理「退休計畫」延後！Gemini接管Android生態還要再等等

AI不再只是燒錢？OpenAI內部數據曝光付費產品運算利潤率已達70%

中國工信部首度批准Level 3級別自動駕駛車輛上路長安、北汽搶頭香

只有硬幣大！soundcore Work AI智慧錄音器配ChatGPT 轉錄還能辨識發言者

美「掃地機器人始祖」iRobot的CEO談公司破產...技術「落後陸企4年」

ROG STRIX XG17AHP攜帶式電競螢幕開箱！240Hz帶出門內建電池、1條線就能辦公玩電動

台灣寶可夢中心開賣22款新品！藤蔓怪圍脖可愛、仙子伊布運動外套仙氣飄飄

電視壁掛、立著放到底誰安全？他曝「離牆太近」有1隱憂影響使用壽命

iPad充電Lightning接頭衰斷在裡面！靠熱熔膠輕鬆取出免送修、網曝另1物更安全

AI不再只是燒錢？OpenAI內部數據曝光付費產品運算利潤率已達70%

AirPods Pro用戶必知！蘋果內建功能＋降噪變「辦公神器」還有客製化更好用

HTC VIVE Eagle智慧眼鏡開箱！日本實測AI即時翻譯菜單聽音樂驚豔、拍出日系照片

Dyson Hushjet ™ 噴射氣流空氣清淨機登場！一次解密輾壓同級的科技淨化性能

LINE免費貼圖10款！7款爽用半年還能過新年添好運、奧樂雞動動貼圖太Q

12月4G、5G便宜資費懶人包／5G 399元搶市！不限速吃到飽方案比4G划算

12月4G、5G便宜資費懶人包／5G 399元搶市！不限速吃到飽方案比4G划算

為什麼總遇到電話響一聲就掛斷或無聲電話？專家急曝4原因：會身陷危機

蘋果2026推2新品被譽「不是第一，但是最好」再掀果粉購買潮

LINE免費貼圖10款！7款爽用半年還能過新年添好運、奧樂雞動動貼圖太Q

睡覺戴Apple Watch「白天沒電怎麼用」？內行1招＋最佳充電時機：舊表重獲新生

HTC VIVE Eagle智慧眼鏡開箱！日本實測AI即時翻譯菜單聽音樂驚豔、拍出日系照片

坐飛機遇行動電源自燃起火怎麼辦？專家曝溫度控制就用它：亂用1物會更慘

蘋果放大招！摺疊iPhone、20周年版手機等7款傳排隊推出功能搶先看

連國文老師都念錯！「獨樂樂不如眾樂樂」不是獨ㄌㄜˋㄌㄜˋ 注音這樣發音

老司機色起來！ChatGPT「成人模式」這時間上線可以鹹溼對話了

12月4G、5G便宜資費懶人包／5G 399元搶市！不限速吃到飽方案比4G划算

外國人誤用大同電鍋惹台人崩潰！緊急湧入留言教學：兄弟你的內鍋呢

LINE免費貼圖10款！這款有小S《康熙》聽不見表情噴笑、另一款終身免費

懶人包／小紅書為何被禁？爆紅原因到爭議一次看懂冒險翻牆恐因小失大

相機熱度大洗牌？他遊日發現櫻花妹最愛「非iPhone手機」：大家都用它

快檢查…美國人今年最常用密碼前20名最容易被破解

iPhone 17 Pro降級5年招牌相機功能？蘋果官方認證了

為什麼總遇到電話響一聲就掛斷或無聲電話？專家急曝4原因：會身陷危機

「LINE Pay給你」是哪種Pay？LINE Pay Money要重新申請嗎？6大問題新舊用戶必看

LINE免費貼圖7款！超Q獨角獸免任務用半年《間諜家家酒》淘氣登場