ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

大模型高考作文比拼,腾讯垫底百度ChatGPT并列第一,幻觉问题成关键

时间:2025-06-07 21:26:20来源:ITBEAR编辑:快讯团队

在万众瞩目的高考日,一场别开生面的“大模型高考作文赛”悄然拉开帷幕。这场由大模型之家主办的赛事,不仅是对莘莘学子知识检验的呼应,更是对当下人工智能领域大模型能力的一次集中考量。

今年的高考作文题并未直接涉及“人工智能”,但大模型之家巧妙地将北京卷的一道考题作为了比赛的试题,以“当数字闪耀时”为题,要求参赛的大模型们创作一篇记叙文。这不仅考验了大模型的创作能力,更是一次对其“生活感知力”的检验。

在紧张激烈的角逐中,国内外7家主流大模型产品悉数登场,包括百度的文心一言、阿里的通义千问、腾讯的元宝、字节的豆包、深度求索的DeepSeek、月之暗面的Kimi,以及OpenAI的ChatGPT。它们各自开启联网能力,准备在这场“写作+幻觉”的比拼中一展身手。

进入第二轮写作能力比拼,各家大模型纷纷拿出看家本领,从取材到写作风格各有千秋,但都能紧扣“数字闪耀时”这一主题,展开丰富的叙述。百度文心、阿里通义、ChatGPT通过多个生活片段的串联,展现了数字在不同场景下的闪耀时刻;而元宝、豆包、Kimi、DeepSeek则更倾向于讲述一个完整的故事,以细腻的笔触描绘数字的魔力。

在阅卷环节,大模型之家采用了智能体阅卷的方式,确保判卷的公平性和准确性。经过智能体的细致评判,腾讯元宝凭借一篇以ICU监护仪数字变化为线索的文章脱颖而出,以49分的高分夺得作文环节的榜首。该文章通过抢救、康复、告别三个场景的串联,深刻诠释了数字作为生命体征载体的意义,情感真挚,叙事流畅。

这场大模型高考作文赛不仅是一次技术的较量,更是一次对人工智能未来发展的深刻思考。它提醒我们,大模型在面对开放性任务时,一旦脱离事实检索或知识边界的校验机制,幻觉问题就可能成为其最大的“绊脚石”。因此,在追求技术进步的同时,我们更应关注模型的准确性和可靠性,确保人工智能能够真正服务于人类社会。

更多热门内容