Sakana AI跑分超越Mythos,但日本AI依然无法与中美竞争!

东京办公楼窗前一条橡皮泥河豚悬在跑分榜单上方,旁边是美国和中国 AI 巨头的模糊标牌,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

日本在 AI 领域里终于追上来了?终于不是中美两国的游戏了?Sakana AI,也就是“鱼 AI”,超越 Mythos 了?

昨天,6 月 22 日,日本一家叫 Sakana AI 的公司发布了一个东西。Sakana 在日语里是“鱼”的意思,它发布的这个东西叫 Fugu,日语里应该就是“河豚”。一上来,它就放了一张跑分图:在 SWE-bench Pro 编程榜上,它最高档拿到了 73.7 分,把 Anthropic 的 Claude Opus 4.8 的 69.2 分,以及 OpenAI 的 GPT-5.5 的 58.6 分,全都压在身下了。

它甚至宣称,连 Anthropic 两个最强的 Mythos 和 Fable,它都已经部分超越了,也就是有些分数比它们还高。于是网上一片欢呼,说日本终于在 AI 领域里赶上来了,不再是中美两国在这玩耍了。

先把结论放在这:别急着高兴。这事看起来像追上来了,扒开一层看看,根本不是那么回事。

Sakana 这条鱼到底是真追上来了,还是又一次聪明的投机取巧?咱们就把这条鱼从头到尾拆开来看一看。

这里要补充一句:Mythos 和 Fable 是 Sakana 自己宣布的口径,没有独立的第三方评测。原因也很简单,这两个模型现在禁用了,只要不是美国公民就用不了,所以他们也没有办法拿出评测数据来。

Sakana AI 到底是什么公司

三条橡皮泥小鱼从东京地图上游出,分别连接聊天、报告和编排系统三个小图标,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

首先把表面一层打开看看,这条鱼到底长什么样。Sakana 并不是一个突然冒出来的草台班子,它有来头,有产品,有跑分,表面上看起来确实比较唬人。

这家公司在东京创建,2023 年成立。它一直主打的不是从零打造大模型,这句话大家要仔细听:它没有从零打造大模型,而是把现成的模型重新组合、编排一下。

阅读更多