大模型能做对数学题吗？

charles

问题描述

目前大模型对一些需要专业能力的场景上还有欠缺，但在通用的能力上确实能够节省一些人力成本。接下来我们会以小学、中学、大学不同阶段的数学题目，来检验下大模型的解题能力。模型使用的是阿里的qwen-vl-max多模态大模型，根据用户上传的题目照片或截图进行解体。

1、小学数学题

大模型能做对数学题吗？

大模型给出的回答如下：

大模型能做对数学题吗？

这道题目是能够准确解答的。

大模型能做对数学题吗？

多模态的大模型给出的回答如下：

大模型能做对数学题吗？

回答错误。

我们在尝试用qwen-max来解题：

大模型能做对数学题吗？

更加离谱。

2、高中数学题

大模型能做对数学题吗？

多模态大模型回答如下：

大模型能做对数学题吗？

又回答错误。

2、考验数学题

大模型能做对数学题吗？

多模态大模型回答如下

大模型能做对数学题吗？

这道题回答是正确的，再来一道试试。

大模型能做对数学题吗？

大模型回答如下：

大模型能做对数学题吗？

又回答正确了，再来一道看看。

大模型能做对数学题吗？

大模型的答案如下：

大模型能做对数学题吗？

回答错误了。

结论：

多模态大模型对于数学题的解答效果不太好，具有不确定性，无法在实际场景中使用。如果把这些题目送给大模型微调，不知道能不能提升解题能力。

本想基于多模态大模型做一个解题小程序，看来技术上是不可行的。

RAG技术前沿技术新闻资讯

Embedding向量模型在RAG本地知识库中如何使用

2025-5-9 22:48:29

RAG技术前沿技术新闻资讯

GraphRAG落地难，微软工业级RAG+Agent实施方案

2025-5-9 23:36:09

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

❯

购物车

优惠劵

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部