同一个计算总金额的问题，AI却总算不对丨AI幻觉

m0_56491492

276人浏览 · 2026-05-01 08:01:30

m0_56491492 · 2026-05-01 08:01:30 发布

同一个计算总金额的问题，A却总算不对。这让我失去对AI计算的信心了。

AI经常会一本正经地胡说八道，出现AI幻觉

在工作中我遇到以下问题，发现怎么问AI都答不对，想了一些方法让AI回答稳定。

大模型本质是根据你的prompt去检索相似向量，本质是概率模型，本就不适合做详细的计算。
一些模型很聪明，对于数值计算问题，会写python去算，而不是根据token直接去预测答案。

一、原始问题

问题如下：计算文本中115项金额总和

1、楚承安  1100元
2、沈景程  1000元
3、陆星遥  1088元
4、楚亦辰  1100元
5、楚文彬  1100元
6、楚文硕  2168元
7、楚少帆  3000元
8、杨锦浩  2188元
9、苏明森  1038元
10、苏茂川  1000元
11、苏恒平  1000元
12、苏锦华  1368元
13、楚泽安  2188元
14、苏锦程  1066元
15、苏宥超  1000元
16、楚韬远  1088元
17、楚博远  6666元
18、楚清和  1100元
19、楚荣邦  1000元
20、苏景春  2000元
21、林沐辰  200元
22、楚振航  1000元
23、楚承良  1280元
24、楚江骁  1288元
25、林绍恒、温静姝 夫妇  2000元
26、苏石安  1000元
27、杨世弘  1000元
28、杨锦帆  300元
29、杨泽江  300元
30、杨景和  200元
31、郑茂安  300元
32、杨世栋  300元
33、杨泽浩  200元
34、杨奕恒  200元
35、杨昌泽  200元
36、陈德新  200元
37、郑承安  1088元
38、苏承城  1000元
39、楚文景  1168元
40、杨世骁  1180元
41、杨世诚  1000元
42、杨林泽  200元
43、杨世康  300元
44、苏瑞辰  388元
45、杨婉兰  200元
46、王希辰  210元
47、苏德胜  400元
48、苏清和  2000元
49、苏贤泽  500元
50、郑兴安  200元
51、杨淑贤  500元
52、楚承泽  1000元
53、杨晓冉  1188元
54、杨晓茹  2188元
55、杨忠恒  1000元
56、陈景斗  400元
57、陈景发  400元
58、楚承坤  1000元
59、王宸云  2026元
60、苏进恒  2026元
61、楚锦钗  5888元
62、苏少峰  2100元
63、楚承吉  2188元
64、苏福安  1100元
65、楚沐青  1100元
66、楚书贞  5000元
67、苏勇宸  2080元
68、杨玉柔  200元
69、苏泽庭  300元
70、苏泉泽  300元
71、郑碧柔  300元
72、杨昌泽  200元
73、苏锦华  1088元
74、苏晚香  200元
75、郑月芦  300元
76、苏明远  1680元
77、陈艺炎  666元
78、苏锦钦  1100元
79、杨金程  500元
80、苏念安  500元
81、苏嘉和  1000元
82、苏屿川  1000元
83、苏建中  1000元
84、郑兴福  200元
85、郑德华  200元
86、楚承山  1000元
87、楚承恩  1168元
88、郑德安  200元
89、苏承云  200元
90、苏景轩  300元
91、苏景同  1000元
92、楚承强  1100元
93、杨石安  200元
94、黄景鉴  1000元
95、吴剑恒  1168元
96、楚宥安  1000元
97、楚春程  1288元
98、楚石安  1000元
99、楚清彦  1000元
100、苏承棠  2180元
101、楚锦华  1000元
102、温沐阳  1100元
103、周景安  1688元
104、苏志宸  1168元
105、黄景旗  200元
106、陈景展  200元
107、陈沐川  200元
108、陈荷安  1000元
109、陈锦龙  1000元
110、苏景宸  1000元
111、苏景成  1000元
112、苏景狮  1000元
113、苏佛安  1000元
114、楚少安  1100元
115、苏承恒  1198元

帮我计算总金额

二、回答结果
DS算的：

千问算的：

豆包算的：

元宝用PYTHON：

KIMI用PYTHON

百度

提示词里没要求用代码，DEEPSEEK逐项累加得出正确答案，元宝和KIMI用PYTHON计算得正确答案。千问豆包文心都不对。

AI名称	AI计算结果	AI使用方法	正确符号和错误符号
DEEPSEEK	122636	逐项累加	✅ 正确
元宝	122636	用PYTHON计算	✅ 正确
KIMI	122636	用PYTHON计算	✅ 正确
千问	109594	累加	❌ 错误
豆包	120348	累加	❌ 错误
文心	121424	累加	❌ 错误

三、想让AI回答计算稳定的方法

我们改一下提示词，在这种数学问题，我想到五个方法，我分别单独测试一下。（未做多次实验，测试结果仅供参考）

方法名称	测试结果正确/错误
方法一：提示词末加“请一步步思考”	✅ DS, 元宝, KIMI ❌ 千问, 豆包, 文心
方法二：提示词重复一次	✅ DS, KIMI, 豆包 ❌ 千问, 文心, 元宝（豆包对了，元宝反而错了）
方法三：勾选深度思考模式	✅ DS, 元宝, KIMI, 文心 ❌ 豆包, 千问
方法四：列出金额表格并用工具求和	✅ DS, 元宝, KIMI ❌ 千问, 豆包, 文心
方法五：必须使用 PYTHON 计算	✅ DS, 元宝, KIMI ❌ 千问, 豆包, 文心