网站地图官方微信:
网站首页 南亨乡 克井镇 茅箭区 正紫镇 沙营镇 阿用乡

当前位置: 首页 >

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。

这是第五题的原题,正确答案是A. - 1/2。

这是之前的第三方的测试结果,6个模型…。

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

  • | 30年过去了,美国没有比B2更强的轰炸机了么? |

    有,b21。 有意思的是,很多知乎军事大佬明明平时很喜欢强...

    查看详情>>
  • | 做个web服务器,gin框架和go-zero怎么选? |

  • | 为什么有些人不喜欢春晚提到饺子? |

  • | MacOS真的比Windows流畅吗? |

  • | 为何 Linus 一个人就能写出这么强的系统,中国却做不出来? |

  • | 编程问题哪里解决? |

  • | 河南人为何如此钟爱胡辣汤? |

  • | 如何评价高圆圆的身材算是美女类型的吗? |

  • | 国内的银行软件搞所谓的“安全键盘”是不是有什么大病? |

  • | 为什么 Go 语言的 Error Handling 被某些人认为是一个败笔? |

  • | 如何阅读Golang的源码? |

  • 个人觉得,webman还不错,性能好,开发也很简单。 或者用...

    2025-06-25
  • 前几天发过一篇GoEdgeCDN手动部署指南,貌似对小白来说...

    2025-06-25
  • 跨平台的gui框架,自绘会更灵活,基本上只要是你能想到的动态...

    2025-06-25
  • 给小孩Youtube Kids,陪他玩Minecraft,他...

    2025-06-25

关注我们

添加微信好友,关注最新动态