ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

融资超百亿,英伟达押注,Baseten成AI推理赛道崛起新势力

时间:2026-06-25 09:33:48来源:快讯编辑:快讯

在人工智能领域,一家名为Baseten的公司正凭借独特的商业模式迅速崛起。这家专注于AI推理基础设施的企业,近期宣布完成15亿美元融资,公司估值飙升至130亿美元。不同于直接训练大模型的公司,Baseten选择了一条差异化道路——帮助企业高效、稳定且低成本地运行各类AI模型。

Baseten的转型故事始于2022年底。创立初期,公司专注于机器学习在反欺诈、内容处理等领域的应用,但前三年收入几乎为零。随着ChatGPT的发布,管理层敏锐捕捉到市场变化——企业真正需要的不是最强大的模型,而是能够根据不同场景灵活调用合适模型的能力。这种认知促使公司转向AI推理基础设施服务,为模型部署提供全流程解决方案。

对于AI应用企业而言,模型选择与成本控制是核心挑战。以AI编程工具为例,复杂代码生成可能调用前沿模型,而简单补全任务则可使用开源方案。类似地,AI销售工具也会将不同任务分配给最适合的模型。这种精细化运营模式,既保证了产品性能,又有效控制了成本。Baseten正是通过解决模型部署中的算力采购、吞吐优化、延迟控制等复杂问题,帮助客户摆脱自建推理平台的重资产模式。

公司服务的客户群体覆盖医疗、销售、编程等多个领域,包括Abridge、Clay、Cursor等知名企业。这些公司的共同特点是产品高度依赖模型调用,对推理基础设施的稳定性与成本极为敏感。Baseten通过整合多家云供应商的算力资源,结合自主研发的软件栈,构建起覆盖模型调度、优化、交付的全链条服务体系。

这种商业模式与云计算发展初期颇为相似。当互联网企业爆发式增长时,亚马逊云通过提供服务器、存储等基础设施服务获得成功。如今,随着AI应用生态的扩张,推理基础设施正成为新的增长点。Baseten在18个月内完成四轮融资,收入增长20倍的业绩,印证了市场对这一赛道的看好。今年一季度,公司年化收入已达6亿美元。

然而,高速发展的背后也隐藏着多重挑战。首先是激烈的市场竞争,Fireworks AI、Together AI等初创公司,以及大型云厂商都在争夺这块市场。例如,Groq被曝寻求6.5亿美元融资,Together AI计划融资10亿美元,估值达75亿美元。这些动态表明,推理基础设施领域正进入白热化竞争阶段。

毛利率压力是另一大考验。虽然Baseten被视为软件公司,但其业务本质仍依赖GPU等硬件资源。算力采购成本、资源利用率、客户定价策略等因素,直接影响利润空间。在GPU持续紧缺、客户要求降价的背景下,如何通过优化技术提升经济模型,成为公司必须解决的难题。同样一块GPU,服务请求越多、空闲时间越短,盈利能力就越强。

技术迭代风险同样不容忽视。AI模型架构、芯片设计、编译器等领域的快速变化,可能使现有部署方案迅速过时。Baseten需要持续投入研发,确保技术栈始终匹配最新需求。这种"追赶式"创新既带来机遇——客户更倾向于将复杂任务外包给专业公司;也构成压力——任何技术滞后都可能导致客户流失。

在这场变革中,英伟达的战略投资尤为引人注目。2026年1月,这家芯片巨头向Baseten注入1.5亿美元资金。这一决策背后,是对行业趋势的深刻洞察。DeepSeek等低成本模型的崛起,曾引发市场对英伟达增长前景的质疑——如果训练强模型不再需要海量GPU,公司核心业务将受冲击。但Baseten的模式证明,模型成本下降可能反而扩大算力需求。

当AI模型从少数大企业的专属工具,转变为中小企业甚至垂直行业的通用能力时,推理基础设施的价值将充分显现。Baseten帮助企业部署开源模型、自研模型和定制模型,通过优化调度降低延迟、控制成本,这种能力使英伟达得以触达更广泛的客户群体。对芯片厂商而言,基础设施公司不仅是客户,更是生态合作伙伴,能够将更多模型运行在英伟达GPU上。

更多热门内容
实测豆包专业版:从质疑到惊喜,国产AI办公新体验真香预警
在途中需要你登录一下,豆包操作浏览器的能力也非常出色,我直接跟它说我注册好了,让它操作浏览器给我发个验证码过来就完了。 虽然说,它现在肯定还有不成熟的地方,但这次实测下来,确实超出了我对"豆包"这两个字的预…

2026-06-25

孙正义股东大会放豪言:AI非泡沫,软银机器人量产,还直言马斯克计划鸡肋
据界面新闻,孙正义表示,“AI革命才刚刚开始,称其为泡沫是对AI的亵渎”,并宣称将以净资产价值(NAV)为基准,目标在未来16年内实现14倍增长,达1000万亿日元。 此前马斯克旗下的SpaceX在招股书中…

2026-06-25

梁汝波首谈字节AI战略:收缩业务聚焦大模型,“勇攀高峰”定调2026
此外,梁汝波称,攀登高峰绝不是某一家公司可以独自完成的,对字节和火山引擎而言,攀登AI这座高峰一定是要和客户一起。 长期以来,字节跳动一直被视为最有可能上市的中国科技企业之一,但公司至今并未表现出急于上市的…

2026-06-25

周鸿祎谈“弃用龙虾”:安全不确定且Token消耗大,AI重塑安全业
周鸿祎表示,自己之前没仔细用过龙虾的时候,对消耗Token没有概念,觉得做AI就得舍得花钱。 周鸿祎提到自己做了半年的安全龙虾,出现了两个让他绝望的问题,也使得他决定在一款新产品里放弃使用龙虾。“有两个原因…

2026-06-25

周鸿祎ISC演讲:360纳米Work亮相,让AI从“能答”到“能干”赋能千行百业
360集团创始人周鸿祎在《从大模型到百亿智能体时代Al进化新路径》主题演讲中,对外介绍了360旗下新一代AI工作平台纳米Work。周鸿祎表示,AI正从"能回答问题"走向"能上手干活",纳米Work要让智能体…

2026-06-25

谷歌Gemini 3.5 Pro推迟至7月发布,借早期反馈优化模型提升性能
IT之家 6 月 25 日消息,据 Business Insider 获悉,谷歌下一代前沿人工智能模型的发布时间已推迟至 7 月。知情人士透露,该公司此前称计划在 6 月推出全新的 Gemini 3.5 P…

2026-06-25

小米17T Pro开售:徕卡影像加持,天玑9500芯片与经典设计共筑旗舰新体验
小米新机量较多,前有小米17T系列,后有红米K90至尊版,均为旗舰级别,但定位各有不同,小米新机倾向于专业影像方面,红米新机倾向于游戏性能方面,定位清晰。 6月初推出的小米17T系列已开售,拥有两个版本,最高…

2026-06-25

REDMI K100或8月抢先登场!双版本屏幕激进 续航音质再升级
快科技6月24日消息,博主数码闲聊站暗示,REDMI K100最快有望在8月登场。 回顾上代产品,REDMI K90于2025年10月23日发布,而小米17则在同年9月25日亮相。但这次情况似乎有所不同——R…

2026-06-25

小米YU7 GT:以高性能俘获年轻心,销量不高却成市场“新宠儿”
用户反馈——定价与交付的双重焦虑总结来看,小米YU7GT以其独特的产品定位、年轻化的消费群体和高价值的销售策略,成功在市场上掀起了一股热潮。尽管销量不高,但其强大的吸引力和良好的口碑无疑让它成为了年轻消费者心…

2026-06-25

小米YU7 GT:高性能俘获年轻心,销量虽缓热度升成市场新焦点
根据博主“张钇平”的销售反馈,小米YU7GT虽然销量不高,但其热度和口碑依然保持良好,显示出该车型在高性能市场中的独特地位。尽管占比不高,但每台车的提成高达2500元,远超普通车型,使得销售人员将其视为“高价…

2026-06-25