语言推论时间减至 1.2 毫秒！NVIDIA 全新 AI 软件实现更强搜索引擎 04月20日更新

语言推论时间减至 1.2 毫秒！NVIDIA 全新 AI 软件实现更强搜索引擎

2025-04-20 208

为使开发人员能打造更高效能的搜索引擎、广告建议与聊天机器人，NVIDIA 近日宣布推出第八代人工智能软件 TensorRT 8，其特色在于能让语言查询的推论时间减半，只需要 1.2 毫秒就能在 BERT-Large 上达到破纪录的语言应用速度，而 BERT-Large 是全世界最被广泛使用的 Transformer 模型之一。

NVIDIA 开发人员计划事业部副总裁 Greg Estes 表示，AI 模型正以指数级的速度变得越来越复杂，而全球各地对于使用 AI 的即时应用需求也随之高涨。这让企业迫切地部署最新的推论解决方案。最新版本的 TensorRT 导入全新的功能，可以让企业把对话式 AI 应用交付给客户，达到更快的反应速度。

TensorRT 8 只需要 1.2 毫秒就能在 BERT-Large 上达到破纪录的语言应用速度，企业以往只能缩小模型的大小，但也因此造成较低的精准度；透过TensorRT 8，企业可以把模型的大小扩增两倍或三倍，大幅提升精准度。

另外，TensorRT 8 还透过另外两个关键功能达成 AI 推论的突破，分别是稀疏性（Sparsity）和量化感知训练。所谓的稀疏性，是 NVIDIA Ampere 架构 GPU 中用以提升效率的效能技术，可以让开发人员借由减少运算作业以加速神经网络。

至于量化感知训练，则让开发人员可以在不牺牲精准度的情况下，运用已训练好的模型和 INT8 的精度运行推论，这让他们在 Tensor 核心上进行高效率推论时，可以大幅减少运算与储存的时间。

（首图来源：NVIDIA）

语言推论时间减至 1.2 毫秒！NVIDIA 全新 AI 软件实现更强搜索引擎

热门推荐

《还愿》回来了！有游戏还有童书，台湾限定实体版开放预购

《还愿》游戏从 Steam 下架！开发商赤烛：维护品质进行检测

《还愿》遭中国网友抵制、团队道歉、中国代理商终止合作，销量反冲高

我们的肉眼每秒能够捕捉多少画面？

最新内容

"Metaphorical Fantasy: ReFantazio"latest new

"Persona 3 Reload".ON PC PS4

姐妹们 !我们村的咖啡馆老火了

库迪瑞幸价格战，小镇咖啡会受影响吗？

王者榮耀攻速暴擊流呂布銘文出裝

王者榮耀最強暴擊流李白怎麽出裝，暴擊流李白出裝銘文裝備推薦

王者榮耀國服夏洛特最強輸出流出裝連招銘文推薦

沒有2023年王者榮耀1月2日更新了什麽？最新改動具體內容

鬥羅大陸魂師對決千仞雪魂環搭配 sp千仞雪技能解析

鬥羅大陸魂師對決最強控製流陣容怎麽搭配？獨孤博阿銀控製流玩法

关于我们

新闻资讯

意见反馈

网站地图