中华网家电

设为书签Ctrl+D将本页面保存为书签，全面了解最新资讯，方便快捷。

业界/ 互联网/ 行业/ 通信/ 数码/ 手机/ 平板/ 笔记本/ 相机

当前位置：频道首页 > 快讯 > 正文

以事实说话，讯飞星火X1和DeepSeek数学能力简测

以事实说话，讯飞星火X1和DeepSeek数学能力简测

2025-03-07 17:21:05 来源：搜狐

小大

军事APP 头条APP

1月15日，科大讯飞发布了当前全国产算力平台上唯一的深度推理模型——讯飞星火X1。3月3日，星火X1迎来升级，数学能力全面对标DeepSeek R1和OpenAI o1，显著提升竞赛级难题应对能力及中小学数学作业批改、辅导等任务表现。同时，首发星火医疗大模型X1，并推出包括星火一体机在内的系列新品。

科大讯飞在官宣中表示，升级后的星火X1之所以会在数学能力上有突破性进展，主要是该版本采用了两大创新技术。

一是通过高效的领域数据自动化挖掘和多类型数据合成算法，构建了海量的数学领域预训练数据，从而显著提升了基座模型的数学专业能力；

二是基于评语模型与强化学习算法，实现了大模型长思维链的激发，同时评语模型还促使大模型在推理过程中进行反思验证，进一步提升了模型在推理阶段的准确性。

那么，这款升级后的星火X1是否真如科大讯飞所说，在数学能力方面可全面对标在业内以推理著称的DeepSeek R1？下面我们就来做一个简单评测。

为保证测试公平性，两款大模型均以首次生成的答案为准。

测试题为《2024年山东省济南市中考数学试卷》中的解答题，8个小题，共72分。为确保输入正确，每题均先截图，然后由两大模型识别图片中的字符并解答。

这一方法，除了能检验两大模型的解题能力外，还能验证其OCR识别能力。毕竟对于数学、物理、化学等学科来说，图形、公式、符号是常态，用键盘输入的方式很难完成。如果OCR识别能力差，无法正确识别文字、字符、公式、图片，不仅会极大影响大模型的解题正确率，同时也会令其适用场景变窄，如无法赋能字纸作业和试卷等。

试题1：

星火X1解答如下：

DeepSeek R1解答如下：

该题分值为6分，正确答案是4，星火X1回答正确得6分，DeepSeek完美答错，答错原因，应该是DeepSeek在识别图片中的字符时，误将“-Sin30°”当成π/2次方数的一部分了。

试题2：

星火X1解答如下：

DeepSeek R1解答如下：

该题DeepSeek R1犯了与第一题类似的毛病，字符识别不正确，误把3x+1①识别成了3X+10，最后导致答案错误。该题满分6分，星火X1回答正确，得6分。

试题3：

星火X1解答如下：

DeepSeek R1解答如下：

该题两大模型完美回答，各得6分。

试题4：

星火X1解答如下：

DeepSeek R1解答如下：

两大模型全部答对，各得8分。

试题5：

星火X1解答如下：

DeepSeek R1解答如下：

两大模型完美地解决了该问题，各得10分。

试题6：

星火X1解答如下：

DeepSeek R1解答如下：

星火X1完全答对，得10分；DeepSeek R1基本答对，只是在解答最后一个问题时，忽略了F点有可能在点C的上方这一事实，只考虑到了当G点在点F右方这一种情况，因此少给了一个坐标。按本大题满分10分，前两小题比较简单，各占三分，最后一小题占4分来打分，DeepSeek R1本题得分8分。

试题7：

星火X1解答如下：

DeepSeek R1解答如下：

星火X1三个小题均给出了正确答案，只是解题过程过于笼统，扣1分，该题满分12分，得11分。DeepSeek R1解题过程相对详细、明了，但最后一小题答错了，扣4分，得8分。

试题8:

星火X1解答如下：

DeepSeek R1解答如下：

两大模型回答基本正确，只是在解答2小题上，都忽略了其实还有一种情况，那就是AC=AD，当AC=AD时，点D还应该存在一个坐标，即（1，√6）；本题满分12分，以每小题4分计，各扣2分，最终两大模型得分均为10分。

小结：

最终两大模型考试成绩见下表：

两大模型成绩汇总（满分：72分）

从两大模型本次考试的最终得分来看，星火X1的数学能力不但能全面对标DeepSeek R1，而且实现了超越。

DeepSeek R1最失分的地方是在试题一和试题二，由于图片文字识别错误导致答案错误，这也充分说明，在OCR识别方面，DeepSeek R1和星火X1相比还有一定距离，后期需要改进。

其它方面，两款大模型差别不大，解题前，都会给出逻辑缜密的思考过程，让用户不但知道应该怎么做，还知道为什么要这么做，以后遇到此类问题时应该怎样思考，这一点非常重要，因为它在“喂”的同时，也起到了教书育人的作用，是学生、家长24小时可随时请教的良师益友。

“人工智能的存在不是为锦上添花，而是要解决社会刚需。”此前谈到人工智能，科大讯飞董事长刘庆峰曾表示。本着这一理念，科大讯飞自推出星火大模型后，就将其广泛落地于旗下各业务，比如教育、医疗、智慧汽车、智慧办公、智慧城市等，并针对C端用户，推出AI学习机、智能办公本、翻译机、录音笔，智能耳机等产品。

责任编辑：kj005

文章投诉热线:157 3889 8464 投诉邮箱:7983347 16@qq.com

关键词：

华硕上架破晓 Pro14 2024 款笔记本：Ultra 5-125H + 32GB + 1TB，5599 元

华硕上架破晓 Pro14 2024 款笔记本：Ultra 5-125H + 32GB + 1TB，5599 元

华为公布鸿蒙 HarmonyOS 4.2 主要亮点，全新小艺支持 AI 消除

华为公布鸿蒙 HarmonyOS 4.2 主要亮点，全新小艺支持 AI 消除

雷柏（Rapoo）V500PRO-87 键盘升级款上架预约，首发价 89 元

雷柏（Rapoo）V500PRO-87 键盘升级款上架预约，首发价 89 元

知名电脑外设品牌冰豹将退出历史舞台，所有产品线并入乌龟海岸

知名电脑外设品牌冰豹将退出历史舞台，所有产品线并入乌龟海岸

久湿人易臭，有体味，一个中成药，快速解决

2025-03-07 16:57:47久湿人易臭，有体味，一个中成药，快速解决

炎症风暴知识科普

2025-03-07 16:34:18炎症风暴知识科普

什么是靶向抗炎

2025-03-07 16:34:06什么是靶向抗炎

甲流引发重症肺炎如何救治

2025-03-07 16:33:43甲流引发重症肺炎如何救治

重症患者炎症反应管理

2025-03-07 16:32:17重症患者炎症反应管理

icu在院患者肺炎管理

2025-03-07 16:32:01icu在院患者肺炎管理

相关新闻

中国红十字会总会授予以岭药业特殊贡献奖

3月6日，中国红十字会总会印发《关于授予2024年度为中国红十字事业作出突出贡献的捐赠人奖章奖牌的通报》。以岭药业榜上有名，获评特殊贡献奖。作为中药行业龙头企业，以岭药业始终秉承“继承创新、造福人类”的企业宗旨，与各地红十字会、医疗机构等携手同行，积极开展与民众健康相关的公益事业。长期以来，以岭药业...

2025-03-07 17:30:13

以事实说话，讯飞星火X1和DeepSeek数学能力简测

1月15日，科大讯飞发布了当前全国产算力平台上唯一的深度推理模型——讯飞星火X1。3月3日，星火X1迎来升级，数学能力全面对标DeepSeek R1和OpenAI o1，显著提升竞赛级难题应对能力及中小学数学作业批改、辅导等任务表现。同时，首发星火医疗大模型X1，并推出包括星火一体机在内的系列新品。...

2025-03-07 17:21:05

家校协同，赋能中高考，这场三千人动员大会振奋人心

2025年3月5日下午，卓越教育全日制“英雄之旅行则必达”中高考赋能总动员大会在广州中山纪念堂举行。广州、上海两地逾3000名师生及家长通过线上线下联动参与，活动现场设置舞狮采青、AI学科寄语、集体宣誓等环节，沉浸式动员备考，激发考生冲刺斗志。庄严的升旗仪式和振奋人心的舞狮采青拉开了本次动员大会的...

2025-03-07 17:19:11

惠城区妇联专题报道美思康宸董事长邓丽君：以创业赋能女性发展用大爱守护儿童成长

近日，在惠城区妇联“巾帼建功‘她’来说”专题报道中，美思康宸集团董事长邓丽君作为新时代女性创业典范获得重点推介。这位从基层成长起来的企业家，以“创业孵化+公益反哺”的双轮驱动模式，书写着助力女性成长、守护儿童未来的动人篇章。创业赋能：构建全链条女性成长生态美思康宸集团深耕大健康产业十余载，邓丽君敏锐...

2025-03-07 17:11:40

追剧党狂喜！鸿蒙原生版爱奇艺支持鸿蒙Vivid标准能力，开启影音新体验

从老少皆宜的年代剧《北上》，到甜到年轻人心巴上的《爱你》，近期爱奇艺的多部热播剧可以说是赚足了大家的眼球。作为国内首批深度适配原生鸿蒙的头部视频平台，爱奇艺自完成Beta版本开发以来，历经多次迭代升级，实现了内容生态与原生鸿蒙的深度融合，在原生鸿蒙应用市场收获了超150万的安装量。鸿蒙原生版爱奇艺已...

2025-03-07 17:11:19

怀宁金拱：送教上门，提升保安员反恐应急能力

为深入推进“四送一服”工作常态化，进一步加强和提升辖区企业保安人员防恐防暴能力，结合辖区企业实际需求，近日，怀宁县公安局金拱派出所联合怀宁县特巡警大队进入辖区企业开展四送一服活动，对保安人员进行防恐应急预案演练。活动中，民警首先向保安人员工作中可能遇到的突发情况，着重向保安人员讲解如何识别可疑人员...

2025-03-07 17:10:28

海尔小家电获iF奖，原来好用不分国界

在全球家电行业的激烈竞争中,海尔智家作为领军者,正从家电第一品牌向创世界一流企业的目标迈进。通过持续的科技创新,海尔智家目前已拥有200余项引领行业的原创科技成果,并依托科技实力为全球用户持续创造差异化家电好物。近日,2025年德国iF奖获奖名单揭晓,海尔智家多款小家电产品上榜,进一步展现其在原创科...

2025-03-07 17:10:09

怀宁金拱所：入户走访听民意安全宣传话平安

为进一步构建和谐警民关系，及时掌握辖区社会治安动态，近日，金拱派出所组织民警开展入户走访活动，倾听民声，宣传法律，全力维护辖区社会治安稳定。活动中，民警深入群众家中，核实基础信息，并了解是否有矛盾纠纷，并及时化解，消除社会安全隐患。同时，积极开展安全防范宣传，尤其是宣传森林防火、用火用电、防盗防骗、...

2025-03-07 17:09:55

东方智慧席卷全球：知意堂掀起海外媒体风暴

————千年文化破壁，中国国学站在世界聚光灯下熠熠生辉2025年，随着离火大运进入到第二年，一场关于东方智慧的飓风从中国席卷至全球——中国优秀的国学平台代表——“知意堂”，因其对中国传统文化的深入研究、传承弘扬和发扬光大，登上了国外数十家主流媒体头条，并被国外300多家媒体转载和报道！这场跨越时空的...

2025-03-07 17:03:37

全球营收增长12%，阿迪达斯成2024年体育大年大赢家

来源：每日经济新闻奥运会、欧洲杯、美洲杯等顶级赛事交织的体育大年，阿迪达斯成为最大赢家之一。3月5日，阿迪达斯公布了2024年第四季度及全年财报。2024年全年，阿迪达斯全球营收236.83亿欧元，在货币中性下（下同）较上年同期增长12%。同期，公司营业利润同比增长超10亿欧元，达到13.37亿欧元...

2025-03-07 16:58:54

家电推荐

家电图片

小仙炖精炖燕窝礼盒荣获超级单品奖，引领健康礼赠潮流

中医机器人亮相武汉民生耳鼻喉医院社区义诊“望闻问切”暖人心

文体专访刘宏：全民健身我们在行动系列赛十年再起航

鹰瞳LED视力康复仪亮相上海眼镜展：AI+PBM技术引领近视防控新未来

盛拓科在京发布太阳能清洁供热新品，引领行业创新潮流

无缝钢管瓦卢瑞克最大的腐蚀专家实验室Maxmill项目，巴西在创新

新闻排行