ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Karpathy周末打造“大模型议会”应用:多模型互评,探索LLM集成新可能

时间:2025-11-23 17:23:42来源:互联网编辑:快讯

与传统单一模型的问答模式不同,llm-council的运作机制颇具创新性。当用户发起查询时,系统会通过OpenRouter将请求同时分发给由多个顶尖大模型组成的“委员会”。目前,该委员会的成员阵容十分强大,包括OpenAI的GPT-5.1、Google的Gemini-3-pro-preview、Anthropic的Claude-sonnet-4.5以及x-AI的Grok-4。

在处理用户查询的过程中,系统会分三步完成工作。首先,所有成员模型都会独立生成各自的回答;随后,这些回答会以匿名形式呈现给所有模型,由它们对彼此的回复进行审阅和排序;最后,一位被指定为“大模型主席”的成员会综合所有上下文信息,生成最终的回复内容。这种设计让多个模型能够像智囊团一样协同工作,共同为用户提供更全面的建议。

在实际测试中,这种协作模式的优势得到了进一步验证。以阅读书籍章节的测试为例,当被问及哪个模型的回答最出色时,委员会成员达成了一致意见:GPT-5.1因回答全面且富有洞察力而被推选为最佳,而Claude则因回答过于简短被评为表现最差,其他模型的表现则介于两者之间。

目前,llm-council的项目代码已在GitHub平台开源,开发者可以自由访问并研究其实现方式。这一举措不仅为技术社区提供了新的研究素材,也为大模型集成领域开辟了新的探索方向。随着更多开发者参与其中,未来或许会出现更多基于多模型协作的创新应用。

更多热门内容
DeepSeek新年发力:梁文锋参与论文发布,mHC技术或引领大模型新方向
这篇论文的核心是提出一种名为mHC(流形约束超连接)的新架构,旨在解决传统超连接在大规模模型训练中的不稳定性问题。 通过深化对拓扑结构如何影响优化与表征学习的理解,mHC将有助于突破现有局限,并可能为下一代…

2026-01-03