ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

趋境科技发布ATaaS平台 引领AI推理服务迈向日均万亿Token产能新时代

时间:2026-03-29 03:00:37来源:互联网编辑:快讯

一场聚焦大模型时代推理服务创新发展的专题研讨会在中关村论坛期间成功举行。本次活动由趋境科技与九源智能计算系统生态联合体联合主办,汇聚了院士、顶尖学者及产业领军人物,共同探讨如何构建高效、稳定、安全且普惠的大模型推理服务体系。

活动现场,启元实验室副主任刘航与工业和信息化部电子工业标准化研究院副院长郭楠分别致辞。中国工程院院士郑纬民作为九源智能计算系统生态联合体理事长,发表了题为《从模型服务到Token服务》的主旨演讲。他指出,随着智能体、AI编程等应用的爆发式增长,2026年已成为"Token爆发元年",产业核心正从模型参数规模转向Token产能的稳定、低成本与高质量交付。郑院士强调,未来智能基础设施需围绕"Token即服务"重构,通过全系统异构协同、存算协同及面向服务等级协议的智能调度三大核心技术底座,实现全链路系统级创新。

趋境科技在会上正式发布新一代AI推理平台——趋境ATaaS高效能AI Token生产服务平台。该平台由趋境科技创始人兼CEO艾智远与郑纬民院士等产业界代表共同揭幕。针对硬件资源闲置、软件适配滞后等四大行业难题,ATaaS平台通过四大自研核心技术实现突破:全球首创的异构推理2.0技术"六合",可降低万卡级集群运营成本超20%;超体量KV Cache缓存技术"月饼",将缓存命中率提升至90%,减少90%GPU算力开销;算子级SLO仿真技术"双仪",实现算力资源智能预规划;极致弹性技术"万象",支持万亿参数模型7秒快速拉起。该平台日均Token产能达万亿级别,标志着AI基础设施从"数据中心"向"Token工厂"的演进。

产业生态协同成为本次论坛的另一焦点。并行科技董事长陈健透露,其MaaS服务在趋境科技支持下,将特定场景集群性能提升50%,为多家头部大模型企业提供服务。九源智能计算系统生态联合体副秘书长王豪杰介绍,联合体已推出全国产化GPU适配方案、九齿领域编程语言等成果,推动国产算力从"可用"向"好用"跨越。京东云、华为、阿里云等企业代表分别展示了与趋境科技在推理引擎优化、昇腾AI集群性能提升等领域的合作成果。商汤科技大装置首席架构师项铁尧表示,其与趋境科技在Mooncake开源项目上的合作,显著提升了算力底座的推理效率。

在圆桌讨论环节,清华大学副教授章明星与中国移动、天数智芯等机构代表,围绕国产推理基础设施发展路径展开深入探讨。与会专家形成三大共识:软硬深度协同是释放国产算力潜能的关键,需通过系统级优化弥合硬件性能与业务需求差距;生态统一与标准建设对打破适配难题、实现规模化应用至关重要;人才培养需通过开源社区、技术竞赛等方式,培育兼具理论与工程能力的复合型人才。

论坛同期宣布启动2026年春季启元人工智能大赛,旨在通过赛教融合模式,为国产智能计算生态培育新一代技术人才,持续推动AI产业开源创新与规模化应用。此次研讨会的举办,恰逢AI产业从模型竞争转向规模化应用的关键转折点,为产学研用各方搭建了深度交流平台,为行业高质量发展提供了新思路。

更多热门内容
英伟达开源框架Polar:助力代码智能体训练,SWE-Bench分数显著提升
IT之家注:GRPO 是一种面向强化学习训练的优化方法,会依据奖励信号调整模型策略,让模型在多步决策任务里学会更优动作。论文还把初始化、运行中、后处理拆到独立工作池,并设置 READY 缓冲区,让运行时预…

2026-05-29

Grok Build 0.1编程实战表现亮眼,成本低于竞品获马斯克盛赞
月 29 日消息,AI 编程智能体 IDE 工具 Kilo Code 今天在 X 平台发布系列图文,分享了 Grok Build 0.1实战开发报告,称构建交付服务过程零工具调用失败,且成本低于 GPT-5…

2026-05-29

iOS 27前瞻:苹果重塑Siri,多模态交互与AI网页搜索功能齐升级
苹果公司“彻底重做”Siri,将其从一款语音助手升级为具备多模态交互能力的AI平台。 核心内容包括:重新设计的Siri界面、引入谷歌Gemini技术的全新底层模型、AI驱动的网页搜索功能,以及一款对标Chat…

2026-05-29

Blackwell架构引领新潮,AI大模型密集发布,能力跃迁与商业变革双加速
花旗研究把"首批基于Blackwell架构训练的模型"列为近期AI竞争中最关键的技术催化剂,逻辑很直接:目前所有排在前沿模型榜单上的产品,包括OpenAI GPT-5.5(花旗AI智能指数60)、谷歌Gem…

2026-05-29

亚马逊关停内部AI排行榜“Kirorank”:纠偏形式化倾向,回归技术实用价值
【环球网科技综合报道】5月29日消息,据《金融时报》报道,亚马逊公司宣布关闭内部 AI 评分排行榜 “Kirorank”,针对部分员工为追求排名、过度消耗算力资源的现象及时纠偏,明确倡导人工智能技术回归实用…

2026-05-29

国产AI芯片迎里程碑!9款芯片通过国家安全可靠测评 昇腾等领衔
2026年5月26日,中国信息安全测评中心与国家保密科技测评中心联合发布《安全可靠测评结果公告(2026年第2号)》,首次将人工智能训练推理芯片纳入安全可靠测评体系。 随着大模型和AI应用在政务、国防、金融…

2026-05-29

解锁教育新玩法!这些互联网新词带你领略学习新体验
指的是教学从来不止局限于方寸教室,走出课堂、奔赴户外,在广阔天地间开展社会实践。对于课堂而言,教师应该保留一些“无目的时间”“无标准答案的问题”以及“无考核压力的角落”,让漫风草思维自然发生。晨读不再是任务…

2026-05-29

Grok Build 0.1 编程实战表现出色,成本低于竞品获马斯克盛赞“物超所值”
月 29 日消息,AI 编程智能体 IDE 工具 Kilo Code 今天在 X 平台发布系列图文,分享了 Grok Build 0.1实战开发报告,称构建交付服务过程零工具调用失败,且成本低于 GPT-5…

2026-05-29

马斯克SpaceX弃JAX选C语言新堆栈 大模型训练提速 硬件算力同步扩张
马斯克还透露,SpaceX正在与其他公司洽谈类似的算力租赁合作,轨道数据中心也在规划中。 更关键的是,和A社抢算力的竞争者恰恰是老马自家人,Grok系列需要训练,Tesla的自动驾驶业务对算力的胃口也在快速…

2026-05-29

Anthropic估值达9650亿美元超OpenAI,数周内将推新型AI模型
据日本共同社5月29日报道,美国人工智能企业Anthropic于28日宣布,其企业估值已达到9650亿美元(约154万亿日元),实现对OpenAI的超越,反映全球高性能AI普及推动的爆发式增长。 公司同时表…

2026-05-29