大模型高考作文比拼，腾讯垫底百度ChatGPT并列第一，幻觉问题成关键-人工智能-ITBear科技资讯

在万众瞩目的高考日，一场别开生面的“大模型高考作文赛”悄然拉开帷幕。这场由大模型之家主办的赛事，不仅是对莘莘学子知识检验的呼应，更是对当下人工智能领域大模型能力的一次集中考量。

今年的高考作文题并未直接涉及“人工智能”，但大模型之家巧妙地将北京卷的一道考题作为了比赛的试题，以“当数字闪耀时”为题，要求参赛的大模型们创作一篇记叙文。这不仅考验了大模型的创作能力，更是一次对其“生活感知力”的检验。

在紧张激烈的角逐中，国内外7家主流大模型产品悉数登场，包括百度的文心一言、阿里的通义千问、腾讯的元宝、字节的豆包、深度求索的DeepSeek、月之暗面的Kimi，以及OpenAI的ChatGPT。它们各自开启联网能力，准备在这场“写作+幻觉”的比拼中一展身手。

进入第二轮写作能力比拼，各家大模型纷纷拿出看家本领，从取材到写作风格各有千秋，但都能紧扣“数字闪耀时”这一主题，展开丰富的叙述。百度文心、阿里通义、ChatGPT通过多个生活片段的串联，展现了数字在不同场景下的闪耀时刻；而元宝、豆包、Kimi、DeepSeek则更倾向于讲述一个完整的故事，以细腻的笔触描绘数字的魔力。

在阅卷环节，大模型之家采用了智能体阅卷的方式，确保判卷的公平性和准确性。经过智能体的细致评判，腾讯元宝凭借一篇以ICU监护仪数字变化为线索的文章脱颖而出，以49分的高分夺得作文环节的榜首。该文章通过抢救、康复、告别三个场景的串联，深刻诠释了数字作为生命体征载体的意义，情感真挚，叙事流畅。

这场大模型高考作文赛不仅是一次技术的较量，更是一次对人工智能未来发展的深刻思考。它提醒我们，大模型在面对开放性任务时，一旦脱离事实检索或知识边界的校验机制，幻觉问题就可能成为其最大的“绊脚石”。因此，在追求技术进步的同时，我们更应关注模型的准确性和可靠性，确保人工智能能够真正服务于人类社会。