ChatGPT

国产大模型和ChatGPT4相比,为什么体验感始终没那么好?

现在国产大模型和ChatGPT4相比,是跑分没输过,体验没赢过。

为什么呢?

因为他们这个是典型的做题家的思路,专门针对各种榜单的问题进行优化,然后去打榜,当然跑分高了。

这就是一种典型的畸形虚高,而且这种方式会导致训练的大模型的综合能力出现问题。

国产大模型和ChatGPT4相比,为什么体验感始终没那么好?