ITBEAR科技资讯

网站首页科技资讯财经资讯分享好友

微软推出38亿参数phi-3-mini模型：每秒可生成12个tokens

时间：2024-04-23 15:19:06来源：ITBEAR编辑：茹茹

【ITBEAR科技资讯】4月23日消息，微软研究院近日公布了一项令人瞩目的技术成果——Phi-3系列AI模型。这一系列模型包含三个版本：mini(38亿参数)、small(70亿参数)以及medium(140亿参数)，分别满足不同场景和需求的应用。

据微软技术报告显示，拥有38亿参数的phi-3-mini模型在经过高达3.3万亿个tokens的训练后，其在基准测试中的跑分性能已经成功超越了Mixtral 8x7B和GPT-3.5等业界知名模型。这一成就彰显了微软在人工智能领域的深厚实力和创新能力。

phi-3-mini模型不仅可以部署在高性能计算机上，还可以轻松应用于手机等便携设备。该模型在27亿参数的Phi-2模型基础上进行了进一步优化，通过整合严格过滤的网络数据和合成数据，提升了模型的通用性和准确性。

尽管phi-3-mini模型在语言理解和推理能力方面表现出色，甚至可以媲美更大参数的AI模型，但微软也坦诚地指出，在某些特定任务，如TriviaQA等，其性能仍然受到模型规模的限制。然而，这并不影响phi-3-mini模型在众多领域中的广泛应用前景。

此外，微软还公布了phi-3-small和phi-3-medium两个模型在MMLU测试中的得分，分别为75.3和78.2，显示出这两个模型在处理复杂任务时也具备了相当高的性能。

更多热门内容

阿里巴巴“通义”升级更名“千问”，消费级AI战场再添强劲竞争者

根据官方消息，“千问”定位为阿里旗下最重要的大模型应用入口，其核心能力基于阿里自研的大模型体系Qwen（千问）。分析人士指出，阿里此前在To B市场和模型研发侧拥有技术基础，但在消费端应用分发层面还未形成…

2025-11-15

阿里巴巴“通义”App升级更名“千问”，AI战略转向消费级市场新布局

根据官方消息，“千问”定位为阿里旗下最重要的大模型应用入口，其核心能力基于阿里自研的大模型体系Qwen（千问）。分析人士指出，阿里此前在To B市场和模型研发侧拥有技术基础，但在消费端应用分发层面还未形成…

2025-11-15

图灵测试已落伍？奥特曼携手量子计算之父提出新标准衡量AI智能

【新智元导读】随着现在的主流大模型都能轻松通过图灵测试，这个持续了数十年的标准开始逐渐过时。奥特曼和量子计算之父David Deutsch讨论得出了一个新的图灵测试2.0标准，可以更好地衡量究竟怎样AI才…

2025-11-15

AI赋能时代：普通人如何借力AI工具，实现个人能力的跃迁与进化？

2025-11-15

UCLA等团队研发ARES框架：让AI学会“量体裁衣”式智能推理

2025-11-15

Salesforce革新AI训练：Webscale-RL破解数据困局，效率跃升百倍

2025-11-15

OpenAI新突破：训练稀疏模型，为破解大模型“黑箱”指明新方向

2025-11-15

上海财大团队打造AI统计推理评测体系填补智能评估关键空白

2025-11-15

港大团队新研究：AI变身“研究侦探”，评估框架解锁智能助手新能力

2025-11-15

港理工团队新突破：AI无需额外训练，推理能力随计算投入显著提升

2025-11-15