ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

清华90后创业者季宇:行云集成电路“褐蚁”一体机,挑战AI算力新高度

时间:2025-04-30 23:56:07来源:ITBEAR编辑:快讯团队

在AI算力领域,一家由90后清华学子创立的初创企业——北京行云集成电路有限公司(行云集成电路),近日宣布推出其全新一体机产品“褐蚁”。这款产品在价格与性能上均实现了突破,仅需最高15万元,即可运行满血版的DeepSeek R1/V3大模型,对话速度更是达到了每秒20个token。

行云集成电路的创始人兼CEO季宇,在接受采访时透露,“褐蚁”一体机已经成功适配了阿里最新发布的Qwen3系列开源大模型,包括其顶配版本Qwen3-235B-A22B。季宇本人是清华大学物理系本科毕业生,并在该校获得了计算机体系结构方向的博士学位,曾以“华为天才少年”的身份,在海思负责昇腾芯片编译器的研发工作。

“褐蚁”一体机提供了三款不同配置,以满足不同用户的需求。其中,性价比最高的“超大杯”版本HY90,搭载了双路AMD EPYC 9355服务器、24条48G 6400M频率的内存以及NV 5090D计算卡,支持FP8和INT4两种数据精度。在FP8精度下,其运行满血版DeepSeek的对话速度可达每秒21个token,而在INT4精度下则能达到每秒28个token,最高支持128K的上下文,售价为14.9万元。行云集成电路还将推出“大杯”HY70和“中杯”HY50两个版本。

季宇团队表示,通过对推理引擎的独家优化,行云集成电路成功提升了推理效率,使得“褐蚁”成为国内首款在10万元价位提供满血FP8精度模型、每秒20个以上token速率的一体机产品。该一体机还可配置各类调用大模型API的应用,为用户提供了极大的灵活性。

行云集成电路成立于2023年8月,其核心团队汇聚了来自清华大学及全球顶尖芯片公司的精英人才,致力于研发下一代针对大模型推理场景的高效能GPU芯片。公司的创始人除了季宇外,还包括CTO余洪敏。季宇在华为期间曾负责多个昇腾编译器项目,并在AI编译器领域和处理器微架构领域取得了诸多突破性成果。

在融资方面,行云集成电路于2024年11月宣布完成了总额数亿元的天使轮及天使+轮融资,投资方涵盖了智谱AI、仁爱集团、中科创星、奇绩创坛、水木清华校友基金、嘉御资本、春华资本、同创伟业、峰瑞资本等多家知名机构。

随着AI技术的快速发展,多家芯片、服务器、云计算、运营商等领域的公司都推出了DeepSeek一体机产品,市场竞争异常激烈。然而,能够运行满血版DeepSeek-V3/R1模型的企业并不多,行云集成电路凭借其“褐蚁”一体机,在国产GPU芯片领域占据了一席之地。

尽管一体机在市场上备受追捧,但一位行业人士指出,一体机核心解决的是部署易用性问题,相比复杂的云计算解决方案,一体机具有项目落地周期快、私有化安全性高、价格更具性价比等优势。然而,一体机也存在持续维护、升级以及大规模数据调度等难题,且综合使用成本较高,难以复用。

对此,季宇表示,目前一体机依然能够运行超大杯的MoE模型和30b当量的dense模型,后续模型迭代问题并不大。相比其他一体机产品,行云集成电路的“褐蚁”在显存、KTransformers等层面拥有更多的技术研发能力,为用户提供了更好的使用体验。

据透露,行云集成电路下一步将自研GPU卡,以进一步降低价格并提高tps体验。同时,公司还将实施由30台“褐蚁”一体机组成的“蚁群”方案,发挥分布式系统优化能力,支持500-1000的有效并发数,价格有望降至300万-400万元,低于英伟达HGX H200集群的整体硬件成本。

随着AI技术的不断进步和应用场景的不断拓展,国内AI算力行业正迎来前所未有的发展机遇。行云集成电路作为该领域的佼佼者,将凭借其强大的技术实力和创新能力,为用户提供更加高效、便捷、低成本的AI算力解决方案。

更多热门内容
Meta一季度广告销售强劲,2025年AI支出预期上调推高股价
Meta beat Wall Street expectation both top and bottom line for thequarter ended March 31. Revenue popp…

2025-05-02

微软股价飙升近8%!Q3 Azure云业务强劲,不确定中显韧性
Microsoft posted strong results across the board for third fiscalquarter ended March 31, 2025. Revenue…

2025-05-02