18+

APMIC「PrivModel」AI方案全面支援OpenAI gpt-oss模型 準確率提升40%、推論成本大降90%

企業自主AI解決方案業者APMIC (Accelerate Private Machine Intelligence Company)今日 (8/19)宣布,旗下「PrivModel」服務方案全面支援OpenAI 近期推出的gpt-oss系列模型 ,在特定應用場景下可實現準確率提升約40%、推論成本 降低達90%的成果。同時,APMIC也任命資深GPU 與AI晶片 專家陳尹鈞 (Ian Chen)擔任美國總經理,進一步強化北美市場 的在地化運作與策略合作,推動企業私有化AI的全球落地發展策略。

gpt-oss 結合 PrivModel:高精準度與低成本並進

APMIC將原先的「S1 Distillation」方案全面升級為PrivModel,並且與OpenAI gpt-oss系列 (包含gpt-oss-120b與gpt-oss-20b)深度整合。根據內部測試,透過微調與蒸餾技術,模型在FP4精度下仍能維持穩定表現,準確率平均提升40%,推論成本則大幅下降 90%。

蒸餾後的模型可在NVIDIA RTX Pro 6000平台維持高效運行,並且首度支援繁體中文 思維鏈 (CoT)推理,讓企業在合規框架下,能以「推理式AI」 (Reasoning AI)的方式進行私有化佈署。

APMIC指出,傳統QLoRA (Quantized LoRA,大型語言模型微調)的方法,在學習專業知識上仍有限制,因此團隊同時結合CPT、SFT、RL等方式才能完成深度微調。在 TMMLU+在地知識測試中,gpt-oss系列模型全數可達80分以上,相較2023年gpt-3不足60分情況有顯著進步,甚至在醫療應用領域更比o4 mini高出13分,而數學邏輯表現僅差2分。

此外,PrivModel還補足gpt-oss系列在視覺能力上的不足,協助企業打造專屬且具商業價值的私有AI模型。

與產業鏈夥伴深度合作,確保安全落地

APMIC執行長吳柏翰 (Jerry Wu)表示,PrivModel搭配「PrivStation」架構後,可提供媲美o4 mini等級的運作性能,並且透過 CKmates、GMI Cloud、Glows AI、Ubilink等算力合作夥伴,以及Dell、HPE、NVIDIA等硬體廠商支持,確保模型能在最新Blackwell 顯示架構設備上穩定運行。

同時,APMIC也結合CyCraft的安全防護,確保企業在私有AI佈署過程中,不僅能有效鎖住自身知識資產,還能以更低成本享受高效能推論,真正實現「從模型到決策」的應用路徑。

資深GPU專家領軍,推動北美市場

在組織佈局上,APMIC同步宣布任命陳尹鈞擔任美國市場總經理。陳尹鈞擁有超過20年GPU與AI晶片產業經驗,曾在NVIDIA矽谷、香港與台灣分公司歷任工程與業務管理職務,專注於高階繪圖卡與資料中心GPU相關業務。

未來,陳尹鈞將專注於推動PrivModel與PrivStation在北美市場的落地,並且與GPU雲服務、OEM、設計軟體公司合作,拓展金融、製造等對 合規AI需求高的產業應用。

透過技術創新與全球布局,APMIC期望讓企業能以更低成本、更高精度、更安全的方式部署AI,並且加速「私有化 AI」的產業落地,推動從資料保護到商業價值的全方位轉型。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

本日熱門 本周最熱 本月最熱