O3Mini PK DeepSeek
O3Mini PK DeepSeek
最近 OpenAI 也是被 DeepSeek 逼的放出了最新的模型,并且放出来思考的过程。根据最新的模型排行,发现 o3-mini-high 排在了第一。从网上看到很多人在测试代码能力,我这里也挨个试试,看看效果如何。
可视化的场景里,这种好与不好可以很直观的看出来,但是也有很强的主观性,每个人观点不太一样,这里主要是放出来效果。而且这个场景也不能说明模型真的强或者不强,只是这个场景或者提示词下是这样的,换个提示词可能就不好说了。
提示词 1
1
Simulate a ball bouncing in a spinning hexagon with gravity & friction.
o3-mini-high 的效果: 如果是 ChatGPT 网页上测试,现在发现还是会降智,这点很恶心,测试了半天发现被降智了。下面这个是没降智的情况。
o3-mini 的效果: 令人诧异的是 o3-mini 还比 o3-mini-high 更好了一点,但是大概过了一圈左右,这个小球还是跑出去了。这里时间太长了,gif 没办法上传。
Claude-3.5-Sonnet-1022 的效果:
提示词 2
1
Write a p5.js script in HTML that simulates 25 particles in a vacuum space of a cylindrical container, bouncing within its boundaries. Use different colors for each ball and ensure they leave a trail showing their movement. Add a slow rotation of the container to give better view of what's going on in the scene. Make sure to create proper collision detection and physic rules to ensure particles remain in the container. Add an external spherical container. Add a slow zoom in and zoom out effect to the whole scene.
o3-mini-high 的效果: 小球的轨迹似乎更好了
o1 的效果:
欢迎关注公众号
本文由作者按照 CC BY 4.0 进行授权