Skip to content

自从GPT发布以来好像每2个月就有一个新LLM模型,国外的gemini,llama,claude,国内的文心一言,智谱清言,豆包,deepseek。但是除了ds-R1这个创新思考模式其实差距都不大,在这周末我初次体验了Grok3我感觉这是一个基于deepseek之后的目前最好的LLM。

为什么这么说呢。在这么说之前我觉得 Grok 这个名字是真不好听,Grok 就像是哪本英文高数书里的莫名奇妙的一个复杂的数学名词一样不好记且难听。但是我用了Grok3 之后是我先入为主了,首先这是马斯克发布的,马斯克一般也不怎么吹很大的牛(笑,我觉得Elon还是个务实主义者。

免费版的grok3能力很强,我提了几个科研问题也都回答的很不错很有逻辑不是在乱答这里没有使用他的深度思考功能,grok3也能够有很强的推理逻辑能力。这个是在免费版的4o上看不到的,就算是4o加上openai新出的推理我感觉gpt的回答总是非常死板。并且grok3背靠推特这个实时的巨量数据库,自动绑定联网搜索真的是秒杀了90%的LLM服务。比如我去问 grok3 的这个新出的火星logo是什么时候更新的,grok3的回答特别精准。

eb44a1e4372a99775f09ccfd10e6dd02.png

虽然相同的问题去问gpt也能有所察觉,但是 grok3 回答质量上我觉得信息是符合用户直觉的。

在情感推理上,如果有情绪方面的问题,如果问gpt4o的回答大部分是教用户怎么做,比较死板的列出方法,grok3 是顺着用户的情感并且中文语言很细腻不死板。

同时还去试了试 grok3 检索论文pdf的能力,我发现还是很强的,能够很快的找到论文的名词出现的位置并且给予解释,我觉得 grok3 很强,在我心里这是一个力大砖飞的目前最好模型。

最后吐槽一下 grok3 这个新 logo 真的一般,不能说不好看吧。原本用的Xai的logo我觉得很好看,那种文字完美融合的感觉我觉得真是很有感觉。

b33d5f98a25656e55bdf151227cb183f.jpg

YisuX.com