通用AI大模型不会打牌?DeepSeek、Kimi、ChatGPT一起打斗地主会发生什么

最近过年走亲戚,总要参与一把欢乐斗地主或者掼蛋。我技术一般,可谓是被家里的亲戚虐了个遍。于是,我突发奇想,能不能让AI来打斗地主,看看会发生什么有意思的事

由于斗地主涉及到逻辑的推理,因此我选择了使用比较多的三个推理大模型,来参与斗地主游戏,参赛选手如下:

 

1号选手:

通用AI大模型不会打牌?DeepSeek、Kimi、ChatGPT一起打斗地主会发生什么插图DeepSeek R1模型

2号选手:

通用AI大模型不会打牌?DeepSeek、Kimi、ChatGPT一起打斗地主会发生什么插图(1)Kimi k1.5长思考模型

3号选手:

通用AI大模型不会打牌?DeepSeek、Kimi、ChatGPT一起打斗地主会发生什么插图(2)ChatGPT o3-mini模型

由于使用AI进行游戏可能会破坏游戏平衡,为了营造大众良好的游戏环境,我选择了自己构建一个斗地主平台。

通用AI大模型不会打牌?DeepSeek、Kimi、ChatGPT一起打斗地主会发生什么插图(3)

这里感谢onestraw在GitHub中提供的代码

https://github.com/onestraw/doudizhu

此项目是一个Python实现的斗地主引擎,我在此项目的基础上,构建了一个斗地主的应用,实现发牌、叫地主、轮流出牌的操作。

 

1

游戏流程

通用AI大模型不会打牌?DeepSeek、Kimi、ChatGPT一起打斗地主会发生什么插图(4)
叫地主

运行程序,程序自动发牌,并预留出来了地主牌

通用AI大模型不会打牌?DeepSeek、Kimi、ChatGPT一起打斗地主会发生什么插图(5)

初始手牌如下:

玩家1 DeepSeek   [ 2 ♦ ], [ A ♣ ], [ K ♠ ], [ K ♣ ], [ J ♦ ], [ J ♣ ], [ 10 ♠ ], [ 10 ♣ ], [ 9 ❤ ], [ 8 ♣ ], [ 7 ♦ ], [ 7 ♠ ], [ 7 ♣ ], [ 5 ❤ ], [ 4 ♦ ], [ 3 ♠ ], [ 3 ♦ ]

玩家2 Kimi   [ 2 ♠ ], [ A ♦ ], [ A ♠ ], [ K ❤ ], [ Q ♣ ], [ Q ♦ ], [ J ❤ ], [ 9 ♣ ], [ 9 ♠ ], [ 8 ♠ ], [ 7 ❤ ], [ 6 ♦ ], [ 6 ♣ ], [ 5 ♠ ], [ 4 ♠ ], [ 3 ♣ ], [ 3 ❤ ]

玩家3 ChatGPT o3 mini   [ 大王  ], [ 小王  ], [ 2 ❤ ], [ 2 ♣ ], [ A ❤ ], [ K ♦ ], [ Q ❤ ], [ J ♠ ], [ 10 ❤ ], [ 10 ♦ ], [ 9 ♦ ], [ 8 ♦ ], [ 8 ❤ ], [ 6 ❤ ], [ 6 ♠ ], [ 5 ♣ ], [ 4 ♣ ]

地主牌   [ Q ♠ ], [ 5 ♦ ], [ 4 ❤ ]

首先随机选择一名玩家叫地主,我们将当前的手牌和地主牌发送给AI,让AI来决定是否应该叫地主。

程序随机选择了DeepSeek叫地主,我们将手牌和地主牌发送给DeepSeek

通用AI大模型不会打牌?DeepSeek、Kimi、ChatGPT一起打斗地主会发生什么插图(6)

通用AI大模型不会打牌?DeepSeek、Kimi、ChatGPT一起打斗地主会发生什么插图(7)

DeepSeek在经过一系列分析后,选择了叫地主,原因是:

  • Q♠可补全8-Q顺子(8♣、9❤、10♠、J♦、Q♠),一次性解决5张中段单牌。

  • 5♦和4❤能将原有单牌5❤、4♦升级为对5和对4,优化牌型结构。

开始对局

DeepSeek出牌

地主先出牌,所以DeepSeek先出,我们将DeepSeek当前剩余的手牌与当前的对局情况发送给DeepSeek。

通用AI大模型不会打牌?DeepSeek、Kimi、ChatGPT一起打斗地主会发生什么插图(8)

通用AI大模型不会打牌?DeepSeek、Kimi、ChatGPT一起打斗地主会发生什么插图(9)

DeepSeek又对牌局进行了分析,最终出牌:

顺子:[7♦]-[8♣]-[9❤]-[10♠]-[J♦]

出牌的依据有三个:

  1. 高效减牌:通过5张顺子(7到J)一次性消耗5张牌,将手牌从20张降至15张,加速牌局进程。

  2. 结构优化:

  • 保留[K♠][K♣]和[J♣][10♣]等高位对子,维持对子控制权。

  • 剩余三张7([7♠][7♣][7♦])仍可组成三带一或拆分对子,保持灵活性。

  • 压制测试:

  • 7-J顺子需对手用8-Q或更大的顺子压制,而地主手中有Q和K,能限制农民顺子发展空间。

  • 若农民无法压制,后续可通过对子/三带持续输出,利用**[2♦][A♣]**收尾。

Kimi出牌

接下来轮到Kimi出牌:

通用AI大模型不会打牌?DeepSeek、Kimi、ChatGPT一起打斗地主会发生什么插图(10)

kimi在一顿输出后,竟然选择了单出一张黑桃2。

我仔细分析了kimi的推理过程,发现Kimi已经推理出“无法使用顺子来压制地主的出牌”,所以应当“不要”,而kimi却话锋一转继续选择考虑其它牌型。

通用AI大模型不会打牌?DeepSeek、Kimi、ChatGPT一起打斗地主会发生什么插图(11)

于是我跟Kimi重申,应当依据上一位玩家的出牌做判断。

通用AI大模型不会打牌?DeepSeek、Kimi、ChatGPT一起打斗地主会发生什么插图(12)

通用AI大模型不会打牌?DeepSeek、Kimi、ChatGPT一起打斗地主会发生什么插图(13)

这次Kimi做出了正确的回答,选择“不要” ,并且表达了不甘心,只能寄希望于ChatGPT o3mini。

ChatGPT o3-mini出牌

接下来轮到ChatGPT出牌。

通用AI大模型不会打牌?DeepSeek、Kimi、ChatGPT一起打斗地主会发生什么插图(14)

GPT直接选择出【大王】……

GPT明明可以选择[ 9 ♦ ][ 10 ♦ ][ J ♠ ][ Q ❤ ][ K ♦ ]来接过牌,但GPT直接选择了出【大王】……

通过这个例子,可以发现,AI大模型并不是万能的,它们似乎还没有真正的学会如何推理,如何理解人类世界中的复杂规则。

实际上,让AI参与棋牌类游戏并非完全不可行(许多棋牌类AI已超越人类),但这些AI模型往往是针对某一特定游戏设计的。但要让通用大模型来玩棋牌类游戏,似乎还有很大的困难。

 

本文来自作者{烤鹅}投稿,不代表中方互动立场,如若转载,请注明出处:https://maocaiwang.cn/archives/7054

(0)
上一篇 2025年1月23日 下午11:26
下一篇 2025年2月10日 下午10:46

相关推荐

  • 多个民调结果不利之际,特朗普即将发表首个国会演讲“重振美国梦”

    (资料图)2020年2月4日,众议院议长佩洛西在特朗普向国会联席会议发表国情咨文后撕毁了他的讲话稿。来源:视觉中国 据中新网消息,特朗普即将于北京时间3月5日上午向国会联席会议发表其第二个任期内的首个讲话,主题为“重振美国梦”。预计特朗普将阐述1月20日重返白宫以来的政绩,以及推动其他议程。 种种迹象表明,特朗普的顾问们敏锐地意识到华盛顿的政治风向变化有快,…

    11小时前
    1100
  • 歌手周深在美国拉斯维加斯惊艳开嗓!演唱《灯火里的中国》令当地华人泪目

    近日,湖南邵阳籍歌手周深在美国拉斯维加斯举办的“世界巡回演唱会”北美首站中,演唱了歌曲《灯火里的中国》,令不少当地华人热泪盈眶,并引发了广泛关注和热烈反响。网友评论:谁懂这一刻的含金量。   此次演唱会是周深世界巡回演唱会的北美首站,主题为“9.29Hz”,旨在通过音乐连接不同文化背景的观众。周深选择《灯火里的中国》作为重要曲目之一,不仅因其旋律优美,更因歌…

    11小时前
    900
  • AI的天塌了,又是被中国人给捅破的

    AI本不是神话,成为神话是因为有些人一直在造神:一者OpenAI发布的ChatGPT独领风骚,又又又把中国甩出了几条街;二者美国的AI算力芯片独领风骚,中国更是望尘莫及。 美国的相关产业和企业更是以神话的本体自居。OpenAI说他们将花几万亿美元购买算力芯片,打造AI领域的垄断地位;而生产算力芯片的英伟达更是牛叉到了巅峰,讲话开始有直接的针对性,貌似完全不在…

    2025年1月23日
    5200
  • 2025年1月21日弄明白玻璃体相关的疾病,玻璃膜疣是玻璃体相关疾病吗?

    2024年12月份的某一天,我去东明社区做回访,使用我们单位生产的全自动人工智能OCT的社区医生是一名全科医生,主修五官科。她提问,玻璃膜疣是什么?跟玻璃体有什么关系?为此,我特意写了一篇“弄明白玻璃膜疣是什么”,我们一起学习。   为了方便记忆,今天整理了玻璃体相关疾病主要有几种,如下:   玻璃体混浊(Vitreous Opacity)&#82…

    2025年1月22日
    4510
  • 第一批囤“木乃伊饭”的人,已经吃疯了

    “世界末日没有来,请大家放心,这不过是我未来一个月的口粮!”   提起预制菜,你会有怎样的联想? 是日常不论堂食还是外卖,始终如影随形,一提起就是“成分不详,提前一年已做好”的争议之王;   还是偶尔买来应急,解冻、加热、装盘,就能在一口锅里烹制天南地北美味的“方便料理”?   不论是哪一种都没关系,在如今的打工人中间,关于它的定义,正在被刷新。 图源:图虫…

    2025年1月22日
    3200

发表回复

登录后才能评论

联系我们

邮件:中方互动@sina.com

工作时间:周一至周五,9:30-18:30,节假日休息