设为首页
|
收藏网址
只需一步,快速开始
微信登录,快人一步
扫码登录更安全
登录
|
注册帐号
|
找回密码
搜索
热门搜索:
东华能源
共青河新城
学校
房产
茂名高铁
经济数据
本版
帖子
用户
关注抖音号
关注公众号
下载APP
扫码关注抖音号
扫码关注公众号
扫码关注APP
快捷导航
首页
网站首页
论坛
茂名在线论坛
食品安全抽检投票
茂名在线家居网
求职网
茂名求职网
APP
关于我们
关于我们
茂名论坛
»
论坛
›
互动茂名
›
话说茂名
›
首个AI高考全卷评测结果出分,大模型“考生”表现如何?
话说茂名
查看:
2012
|
回复:
1
[今日关注]
首个AI高考全卷评测结果出分,大模型“考生”表现如何?
[复制链接]
扫把捕虫
扫把捕虫
当前离线
主题
0
回帖
精华
初中生
发表于 2024-6-25 15:25
|
显示全部楼层
|
阅读模式
|
来自:茂名在线苹果版
|
来自广东
·大部分大模型“考生”语文、英语科目表现良好,但在数学方面还有待加强。阅卷老师点评,在语文科目上,对于语言中的一些“潜台词”,大模型尚无法完全理解。在数学科目上,大模型的主观题回答相对凌乱,且过程具有迷惑性。
6月19日,首个大模型高考全卷评测结果公布。2024年全国高考结束后,大模型开源开放评测体系——司南评测体系(OpenCompass)选取了6个开源模型包括GPT-4o,针对高考全国新课标I卷“语数外”三门课程展开全卷能力测试。
评测结果显示,阿里巴巴开源的Qwen2系列MoE对话模型(Qwen2-72B)、GPT-4o及书生·浦语2.0文曲星(InternLM2-20B-WQX)成为本次大模型高考的前三甲,在语、数、英三门课程中得分均超过70分。大部分模型“考生”语文、英语科目表现良好,但在数学方面还有很大的提升空间。其中,书生·浦语2.0文曲星(InternLM2-20B-WQX)取得了数学单科的最高分,超越包括GPT-4o在内的所有模型。
回复
举报
嘟嘟的芒果
嘟嘟的芒果
当前离线
主题
0
回帖
精华
博 士
发表于 2024-6-25 23:55
|
显示全部楼层
|
来自广东
看准确率了
回复
支持
反对
举报
返回列表
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
注册帐号
本版积分规则
发表回复
回帖后跳转到最后一页
友情链接:
关于我们
|
商业合作
|
法律声明
|
手机版
返回顶部
返回列表
快速回复
在线沟通请点我
客服1
客服2