ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Redis之父再出手!为DeepSeek V4量身定制本地推理引擎引热议

时间:2026-05-08 22:10:10来源:互联网编辑:快讯

DeepSeek V4发布仅两周,开源社区便涌现出首批专为其打造的原生基础设施。其中最引人注目的,是由Redis创始人Salvatore Sanfilippo(业内称antirez)开发的ds4.c——一个专为Mac平台优化的DeepSeek V4 Flash本地推理引擎。这个项目打破了传统通用框架的路径,选择为特定模型与硬件组合打造极致优化方案。

ds4.c的独特性体现在其"专属高速公路"定位上。该引擎完全基于苹果metal API开发,仅支持Apple Silicon芯片设备,彻底摒弃了对Nvidia或AMD显卡的兼容性。项目代码库异常精简,核心文件由C(55.4%)、Objective-C(30.2%)和metal(13.8%)构成,没有运行时依赖或抽象层。这种设计哲学与antirez此前开发的Redis数据库一脉相承——追求极致的轻量化与性能专注。

性能测试数据印证了这种设计思路的成功。在128GB内存的MacBook Pro M3 Max上,2-bit量化模型配合32K上下文窗口,短提示预填充速度达到58.52 token/s,生成速度26.68 token/s。当升级到512GB内存的Mac Studio M3 Ultra时,长提示(11709 token)预填充速度飙升至468.03 token/s。对于拥有2840亿参数的混合专家(MoE)模型而言,这样的本地运行效率已达到实用门槛。

实现这种突破依赖三大核心技术创新。首先是非对称量化策略:仅对路由专家层进行2-bit量化,而共享专家层、投影层等关键组件保持Q8精度。这种设计在保持模型推理质量的同时,将内存占用压缩至极限。其次是KV缓存磁盘化技术,通过将对话状态持久化存储,使Claude Code等需要发送长初始提示的AI代理,在后续对话中可直接跳过预填充阶段。最后是双协议兼容层,同时支持OpenAI和Anthropic的API标准,并针对工具调用场景进行专项优化。

开发者社区对ds4.c的反应超出预期。项目发布后迅速有开发者在128GB Mac上完成部署,实测显示其能稳定驱动coding agent执行复杂任务。这种成功引发了关于技术发展路径的深层讨论:在GPU成本持续攀升的背景下,针对特定硬件-模型组合进行深度优化的"超专用引擎",是否将成为未来主流?Hacker News上的热门评论指出,这种路径虽然可能面临模型迭代时的重构风险,但能通过消除抽象层获得显著性能提升。

antirez本人在项目文档中坦陈这种选择的双重性。他承认ds4.c当前是为DeepSeek V4 Flash量身定制,但强调本地推理的核心约束不会改变——必须在高端个人设备上实现可靠运行。对于未来规划,这位传奇开发者保持其一贯的谨慎风格:虽然不排除增加CUDA支持的可能性,但明确表示项目将刻意保持小规模、快速迭代和高度专注的特性。

这种技术哲学与antirez的职业生涯形成有趣呼应。从2009年创建Redis并主导开发11年,到2020年短暂离开后重返担任布道者角色,这位西西里岛出身的程序员始终保持着对技术本质的探索。他开发的Kilo编辑器(不足1000行C代码)、航空信号解码器dump1090等项目,都体现着"小而美"的技术追求。2024年出版的科幻小说《WOHPE》,更将其对AI、气候变化的思考融入创作。

在ds4.c的项目文档中,antirez延续了其一贯的幽默风格。当解释macOS虚拟内存bug导致CPU推理路径崩溃时,他写道:"记住,所有软件都很烂。我没法修复这个崩溃问题,因为每次调试都要重启电脑,这实在太无趣了。"这种将技术挑战转化为黑色幽默的能力,或许正是其能持续推动技术边界的关键特质。随着AI推理需求向边缘设备迁移,这位给AI"修路"的程序员,正在书写新的技术传奇。

更多热门内容
道格S300 Pro来袭:大电池强性能四摄全,LCD党新选择但价格劝退?
今天分享的手机是道格S300 Pro,和前两天分享的Bigme新机相比,该机有很多明显的优势:比如国内有旗舰店方便选购,16GB超大运存和11000毫安时电池,还有2亿超清四摄组合和6.78英寸LCD高刷护眼…

2026-07-01

小米辟谣账号正式上线 携手法务部共筑清朗网络与品牌权益防线
近期的一条博文是帮助车主抵御诋毁,博文称自2025年9月26日发布小米车主遭网络攻击专项援助信息收集以来,截至今年5月27日,已有21,983人参与,3,201人提供相关证据信息,目前已帮助73位车主向法院…

2026-07-01