谷歌Gemini 3.1 Flash-Lite发布：速度快成本低，多模态与推理能力再升级-业界动态-ITBear比尔科技

谷歌近日面向开发者群体推出了一款名为Gemini 3.1 Flash-Lite的AI模型，该模型凭借其高速响应与成本优势，成为Gemini 3系列中针对高频工作负载的性价比之选。据官方披露，这款模型专为大规模、低延迟任务设计，支持文本、图像、音频及视频等多模态输入，上下文窗口容量达百万token级别，输出上限为6.4万token，可覆盖从文件摘要到复杂多模态处理的多样化场景。

在性能表现上，谷歌援引第三方基准测试数据指出，相较于前代Gemini 2.5 Flash，新模型的首个答案生成速度提升2.5倍，整体输出效率提高45%，且在质量评估中保持同等或更优水平。在智能能力评估方面，该模型于Arena.ai排行榜斩获1432分，并在GPQA Diamond与MMMU Pro两项专业测试中分别取得86.9%与76.8%的成绩，超越同级别竞品的同时，甚至部分指标优于上一代更大规模模型。

定价策略成为该模型的核心竞争力之一。谷歌宣布，Gemini 3.1 Flash-Lite的输入成本为每百万token 0.25美元，输出成本为每百万token 1.50美元，仅为大型模型报价的零头。这一定价体系特别针对需要大规模部署且对成本敏感的企业用户，例如从事翻译、内容分类等高频任务的开发者群体。

早期测试阶段，多家企业已验证该模型的实际效能。AI叙事平台Latitude反馈称，新模型在指令遵循成功率上较此前模型提升20%，推理速度加快60%，使其能够为更广泛的用户提供复杂叙事体验。AI动画工具Cartwheel首席科学家Andrew Carr则强调，该模型在工具调用与代码库探索方面表现出色，其处理速度达到更大规模模型的数倍，成为处理多模态标注数据的关键工具。时尚应用Whering通过整合该模型，实现了商品标签标注的100%一致性，即使在复杂品类分类中也能保持稳定输出。

企业AI平台HubX联合创始人Kaan Ortabas公布的数据显示，Gemini 3.1 Flash-Lite在根编排与内容处理任务中，持续保持10秒以内的响应时间，流式输出接近实时水准，结构化输出合规率达97%，意图路由准确率达94%，在速度、精准度与成本间取得平衡。目前，该模型已通过谷歌AI Studio的Gemini API与谷歌云Vertex AI平台向开发者开放，无需特定硬件配置即可直接调用。

科创人工智能ETF广发开盘遇冷，重仓股集体走低，投资者如何布局未来？

这一波动也反映出市场对人工智能行业的预期和实际表现之间的差距。广发基金管理有限公司作为该ETF的管理方，基金经理曹世宇的投资策略和判断力将在未来的市场波动中受到考验。在重仓股中，金山办公作为知名的办公软件…

2026-04-13

国产AI芯片进展与创业板新规共振科创50ETF华夏（588000）领涨半导体板块

流动性方面，科创50ETF华夏（588000）盘中换手149%，成交10.88亿元。科创50指数由科创板市值大、流动性好的50只证券组成，其中半导体板块权重近70%，是名副其实的“中国硬科技核心资产”风向…

2026-04-13

3月中大型SUV销量洗牌：理想i6登顶，小米YU7下滑，市场竞争白热化

2026年3月，中大型SUV市场迎来新的销量变局，理想i6以24,000辆的销量强势登顶，超越小米YU7，成为该月最畅销车型。根据最新数据显示，钛7PHEV紧随其后，排名第二，销量达到18,000辆，而小米Y…

2026-04-13