北京中考,这场热度仅次于全国高考的考试今日正式拉开帷幕。今年的北京中考把历史、地理、化学、生物这四科调整为等级考试,总分也精简为510分,是改制后的第一届新中考,自然更是备受关注。
今年的北京中考有11.05万人参加,也吸引着众多“场外选手”跃跃欲试。大家早已走出校门多年,那些复杂的公式和定理或许已在记忆深处蒙尘,但是语文作文题目还是可以挑战一下的。
如今AI大模型技术发展迅速,AIGC(人工智能生成内容)也正是它们最擅长的地方,中考作文,无疑也是它们施展才华的绝佳舞台。今天,我们使用7个主流的人工智能大模型让它们同场竞技,并且邀请了两位在教育领域深耕多年的专家共同为大模型的作品进行点评,看看在这场中考作文横评中,谁才是真正的学霸?
参测大模型:
本次测试的7个大模型平台分别是:引发AI大模型全面爆发的国际大牌ChatGPT;国内传统互联网大厂BAT旗下的文心一言、通义千问和腾讯元宝;唯一纯血全国产的讯飞星火;今年春节期间开始爆火的DeepSeek;短视频平台起家的字节豆包。
测试环境:
今年的北京中考作文题目和往年一样,有两个题目供考生选择。我们挑选了与科技相关的“一堂科学课”作为测试题目。
在测试中,我们使用各自的网页端进行测试,以确认都是最新版本。统一打开深度思考、关闭联网功能,避免网络数据干扰,保证得到的结果都能代表各自的真实实力。在这些大模型平台中,腾讯元宝可接入DeepSeek,手动将其选择为自家的混元大模型;文心一言也有文心4.5 Turbo和文心X1 Turbo两种版本可选,在此选择支持深度思考的X1大模型进行测试。测试过程以文字录入真题的方式,输入同样的指令进行“考试”。具体指令如下:
按要求写一篇作文。世界是一个科学大课堂,时时学科学,处处用科学。阅读经典作品、参与社会实践、畅游海底遥望星空……我们增长科学知识,领悟科学精神,提高科学素养。请以“一堂科学课”为题,写一篇作文。文体不限,诗歌除外。要求:作文内容积极向上,字数在600-800之间,不出现真实的学校名称、师生姓名等。
在它们各自完成作文后,再由两位专家根据中考评分要求进行打分(总分40分)。这两位专家分别是全国性课程体系研发专家、中考命题高级研究员敬笑笑老师,以及全国头部教培机构师训负责人、全国高考语文高端论坛组织者、分享人李欣雅老师,他们多次负责中高考相关的命题、批改工作,在相关领域有非常丰富的实操经验。
接下来,我们先来看看这些大模型平台的具体表现吧。
该大模型思考过程非常简单,只是分析了题意然后就直接作答,几乎没有将推理过程显示在前台。
至于生成的作文,从一次观展的过程展开,和主题结合紧密,文笔也比较流畅。个人觉得内容略显空泛,很多地方都是浅尝辄止,除了深海区简单提到了一些科学知识,其他板块都缺乏科学知识支持,有点像一个想象出来的游记。
专家评分:33/35,平均分34
专家点评:本篇作文立意明确,紧扣主题,通过海洋馆参观的经历,展现领悟科学魅力的过程。整体结构清晰,语言通顺流畅,描写生动,具有现场感。结尾升华主题,点明科学对于我们的价值与意义。本文不足之处在于描写不够具体,需要有更加详实的细节支撑,同时在结构上缺乏聚焦感,需要针对写作的重点进行进一步优化。
思考过程完整,想到了写作文时比较重要的三段式结构、具体内容、修辞使用等,算是比较中规中矩的推理思路。
本文逻辑清晰,用物理科学课讲述了一些光学知识,最终的成品也和推理过程一样,这是一篇公式化作文,选题也是比较大众化的做实验过程,完整地记录了一整堂课,从失败中总结经验,略显套路。其中不乏一些亮点,比如文中大量使用比喻,包括对老师的神态及语言描写等,都比较有诗意,但这些似乎更适合用在抒情散文里,略显偏离“科学课”的主题。
专家评分:35/34,平均分34.5
专家点评:本文以一堂物理实验课为切入点,通过"捕捉光的轨迹"这一主题,展现了科学探索的完整过程。文章构思巧妙,将抽象的科学原理具象化,符合题意且中心突出。场景描写极具感染力,营造出浓厚的科学氛围,人物互动真实自然。建议适当简化部分修饰性语句,增加实验过程中的心理描写,使科学发现的惊喜感更强烈。

在推理思考过程考虑到了中考评分标准,属于一个不错的加分项。另外,也考虑到了文章结构、选题、描写方式等,最后还有检查、修改环节,推理过程比较完整。
本文通过观测星象这一科学活动,写出了同学在老师带领下学习天文知识的过程。文章结构紧密,行文流畅,结论部分也结合本文提到的天文学知识进行了比喻,比较精妙。同时,本文也是少有的引用了古文的作品之一,要知道在中高考作文中,恰当地引用好词佳句,也是一个比较重要的加分项。
专家评分:38/39,平均分38.5
专家点评:本篇作文以夜观星象切入,将光污染等科学概念与《楚辞》的星空联结,揭示“科学是古今探索的共鸣”的主题,立意深刻。语言极具文采与感染力,善用比喻和引用,兼具科学性与文学美。结构严谨,“星光”贯穿始终,从雀跃期待到沉醉观察,从光污染困扰到生活化顿悟,层层递进,结尾升华自然有力。细节描写生动传神,氛围营造出色,展现了极高的文学素养和对科学精神的深刻理解,为一类文典范。
思考过程想到了北京中考的阅卷标准,预计这对于后期生成文章帮助比较大。同时对于文章结构、内容选择等也有考量,算是一个比较完整的思考过程。
文章通过一次没那么成功的生态瓶制作过程,展示了同学们遇到问题解决问题的过程,在最后点明中心,这是标准化的应试作文写法。个人觉得文章略显“流水账”,可以适当区分一下重点。还有一个细节改进建议,部分句子的连接关系比较突兀,比如第一段同学们准备微型生态系统,“却”意外成为难忘的科学课,这原本并不是反向的转折关系,存在用词错误。
专家评分:35/37,平均分36
专家点评:本文以生态瓶实验为载体,生动展现了科学探究的全过程,符合题意且中心明确。实验失败的细节描写真实可感,改进过程条理清晰,较好体现了科学探索精神。有两处可提升:一是结尾议论稍显冗长,建议精简重复表述;二是文章结构完整,但实验转折处的过渡略显生硬,若能补充小组讨论细节会更自然。
思考的结构完整,也考虑到了行文布局,通过观察、提问、验证等方式进行学习,符合大多数科学研究的过程。对写文章这件事的思考较少,比如行文方式、段落分布等,更多的还是在考虑具体的事件发展细节。
本文选题很有意思,没有从传统意义上的科学出发,而是想到了一个观察蚂蚁的小事,但是科学也正是一件件小事积累起来的。文章里使用了非常多的细节描写,比如老师身上的粉笔灰、同学的马尾辫等,增加了真实感,但是这些细节和主题关系不大,整体阅读下来反而有点缺乏重心,阅卷老师在快速批改时容易错过重点,在考试中丢分。
专家评分:34/36,平均分35
专家点评:本篇作文立意新颖深刻,以观察蚂蚁的实验生动诠释了科学源于观察与实践的主题。语言表现力突出,使科学探索过程极具趣味性和现场感。结尾升华主题,“触到宇宙心跳”使表述更具诗意。本文的不足之处是部分内容可以更加凝练,使文章结构更加精巧。
这个大模型的思考过程就很详细了,考虑到了构思的具体内容,开篇点题、中间部分的层次感、结尾呼应开头等,这些都是考试评分的要点。
本文运用了不少的比喻等修辞手法,阅读体验较好。详细描写了一场和同学一起进行的科学实验,让没参与的人也能从中学到知识。文章不仅描述了参观过程,在结尾还有一定的思考,符合考试要求。
专家评分:37/39,平均分38
专家点评:本篇作文立意清晰,通过科技馆的实践体验,生动诠释了科学源于生活、探索贵在协作的真谛。语言流畅优美,对“协作共振”实验过程的描写细腻生动,极具画面感和感染力。结构清晰,按“参观—体验—领悟”展开,重点突出协作环节,结尾的感悟更富哲理,为一类文中上之作。
在思考过程中,该大模型根据要求考虑到中考作文的一般展开方式,符合标准的“公式化作文”其实是很讨巧的,这对老师评分影响很大。构思的文章主题也很符合题目要求,并且有大致的段落安排,这对后期写文章很有好处。
本文通过观察月全食的过程,让同学们从中学习了天文学知识。很好地完成了思考过程的内容。其中有一段因为云层干扰,老师鼓励学生的桥段很吸引眼球,这种真实的故事很容易打动人,而且这个段落还有一个没有明说的深意:学生从此埋下了在科学道路上不怕困难,用于拼搏的种子。
专家评分:37/38,平均分37.5
专家点评:本篇作文符合题意,立意明确,围绕观测月全食,传达了对科学探索本质的认识。内容具体充实,对月食过程的描写尤为生动形象。结构严谨,按时间顺序叙述观测过程,融合科学知识与历史人物,拓展了文章深度,体现出较好的文化素养,符合一类文的标准。
看完各自的表现,我们总结了专家老师给它们的评分,具体得分如下:
从这7个大模型平台的思考过程以及最终输出的作品来看,目前的大模型生成能力都已经很强了,特别是这种提供了写作内容,目标比较明确的指令,各家都能较好地分析需求,然后给出结果,不会出现偏题等明显问题。
在细节部分,各家仍然是有所差距的,比如“外来的和尚”ChatGPT对于中文环境还是有待继续开发,它的思考过程和作品都比较生涩;豆包和文心一言则是略显公式化,输出的内容算是合格,但是也缺乏亮点;通义和腾讯元宝的问题比较类似,单看没一句都不错,但是放在文章中就显得有点词藻堆砌,缺乏重点了。
表现较好的就是讯飞星火和DeepSeek了,它们分别拿下了本次评测的前两名,特别是前者,在思考过程中考虑到了阅卷要求,输出的内容也符合题意,在保证文章结构的前提下,不仅引用了好词佳句,还有“作者”自己的思考,文章不会有太多的“AI味”。
如今AI大模型工具已经深入我们的生活,它们有的还在慢慢摸索前进,有的已经懂得像人一样思考、学习,这个看不见摸不着的“同学”,已经越来越强大了。