已知三点坐标求外心(Grok3、Deepseek、chatgpt、kimi实战推理,有一家输得一败涂地)

最新的推理模型哪家强?一文带你了解Grok3、Deepseek、chatgpt和kimi推理模型的实战测评
随着Grok3、Deepseek、chatgpt和kimi等推理模型的相继推出,各家都在展示自己的实力。本文将重点对这些推理模型进行度实战测评,以展示更加公正、透明的对比结果。
我们来看一个逻辑推理问题。Sroan有一个包含七个不同数字的保险箱密码。经过四次猜测后,Sroan表示每个人猜对了位置不相邻的两个数字。我们的测评团队用各家的推理模型尝试解开这个密码。
Grok3耗时129秒成功解答;chatgpt花费3分36秒解答正确;而Deepseek尝试了很长时间但未成功;Kimi则在计算约20分钟后出现死机现象,未能给出正确答案。
接下来是一个排序问题。我们需要将8个人随机安排在教室的两排座位上,其中A与B必须相邻,而C与D不能相邻。在这个问题中,Grok3和chatgpt都给出了正确答案,但Deepseek虽然也能过关,耗时却明显长于前两者。而Kimi则未能给出正确答案。
在解析几何的问题中,我们有一个关于动抛物线、圆锥曲线和动直线的题目。Grok3和chatgpt都能正确解答这个问题,但Deepseek虽然也能过关,耗时较长。而Kimi则再次出现问题,无法给出正确答案。
综合以上测评结果,我们可以得出结论:在逻辑推理、排序问题和解析几何等方面,chatgpt的o3mini模型表现最为出色,Grok3紧随其后,Deepseek的r1模型在逻辑推理时间上稍长,但仍具有强大的实力。而Kimi则在测试中频繁出现问题,表现不够稳定。综合排序为:chatgpt o3mini>grok3>deepseek r1>kimi1.5。从实测结果来看,尽管openai的风评有所下降,但其产品性能仍在不断提升。希望通过本文的测评能帮助大家对各家的推理模型有更深入的了解。
