苹果、英伟达强强联手：LLM推理加速利器ReDrafter开源

苹果、英伟达强强联手：LLM推理加速利器ReDrafter开源 - 果核剥壳

2024年12月19日上午10:06 • 圈内新闻

AI文摘

此内容由AI根据文章内容自动生成，并已由人工审核

Core AI Power

苹果与

12 月 19 日消息，苹果公司昨日（12 月 18 日）发布博文，宣布和英伟达（Nvidia）合作，通过开源 Recurrent Drafter（ReDrafter）推测解码方法，显著提升了 AI 大语言模型（LLM）的推理速度。

苹果公司表示 ReDrafter 已集成到 NVIDIA TensorRT-LLM 推理加速框架中，在 NVIDIA GPU 上，每秒生成 tokens 速度最高提升 2.7 倍，有效降低了用户延迟和计算成本。

苹果的机器学习研究人员指出，LLM 越来越多地用于驱动生产应用程序，提高推理效率对降低计算成本和用户延迟至关重要。

援引苹果官方博文，ReDrafter 使用 RNN 草稿模型，结合波束搜索（beam search）与动态树注意力（dynamic tree attention），可以让开源模型每步生成最多 3.5 个 tokens，超越了先前推测性解码技术的性能。

为将 ReDrafter 应用于生产环境，苹果与 NVIDIA 展开合作，将其集成到 NVIDIA TensorRT-LLM 框架中。

英伟达为此添加了新的运算符并公开了现有运算符，增强了 TensorRT-LLM 对复杂模型和解码方法的适应性。

基准测试结果显示，在 NVIDIA GPU 上使用集成了 ReDrafter 的 TensorRT-LLM 框架，数百亿参数规模的生产模型的解码速度提升了 2.7 倍。这不仅降低了用户体验延迟，还减少了 GPU 使用数量和功耗。

如果您喜欢本站，点击这儿不花一分钱捐赠本站

这些信息可能会帮助到你：下载帮助 | 报毒说明 | 进站必看

修改版本安卓软件，加群提示为修改者自留，非本站信息，注意鉴别

发表回复

qwsa999 2025年5月16日

软件基本是废了，限制太厉害了，昨天刚出的爱死机第四季都禁止下载

评论于迅雷12 v12.1.6.2780
中国第一 2025年5月16日

中国人请说中文

评论于 Lossless Scaling(游戏无损缩放) v3.1.02 绿色版
sorrymj 2025年5月16日

官网已经更新到6.3版本了，不知道能不能更新一下新的学习版？

评论于 Hard Disk Sentinel 5.70.4 修改版
latt1 2025年5月16日

备用用了下冰鼬浏览器挺好的。傻快傻快的。

评论于【果核视频】开源纯净，如果浏览器也需要备胎，我必选它
悠然蓝天 2025年5月16日

你消息落后了，基于28nm，国内已经能自主生产了

评论于雷军官宣小米自研手机 SoC 芯片“玄戒 O1”视频曝光
阿斯顿发生 2025年5月16日

windows系统已经深入人心，换了个平板界面的大电脑，真有些无法适应

评论于鸿蒙PC版发布，不过离"取代Windows"还差N个Linux
ihua 2025年5月16日

可以使用的。。赞赞赞

评论于 Android Meta 元萝卜 v1.0.25
lkmbfn 2025年5月16日

虚假宣传都闹成这样了，还在装死不出来解决问题。

评论于网友这些操作，成功把雷军搞“破防”了..
玄木求鱼 2025年5月16日

离谱了，我找不到这玩意的《循环播放》，还是没有这个功能？

评论于 Android Next Player(视频播放器) v0.13.0
烽火戲豬猴 2025年5月16日

哎，root已死，这些工具很难再有用得上的时候了。以后不会再买小米手机了，后面主要看唯一的一加了，目前来看一加硬件还是差太多，除了旗舰其他机型防水都不做，电池续航也不跟上，后面实在不行就选择iPhone吧。

评论于 Android Magisk(面具模块) v29.0

苹果、英伟达强强联手：LLM推理加速利器ReDrafter开源 - 果核剥壳

相关推荐

发表回复

分享到：