硕鼠的博客站

范路的博客主站,时而会发些东西。

Posts Tagged ‘模型微调’

Llama3.1 405b突然开放,指标上全面超越GPT-4。中国厂商们是不是又可以充了呢?大家好,这里是老范讲故事的YouTube频道。今天咱们来讲一讲Llama3.1 405b 开放的事情。

Llama的开放,每一次都比较有戏剧性,都会有偷跑。什么叫偷跑?就不是由官方开了发布会,说我今天发布了一个什么产品,而是一般都是在Reddit这样的论坛里,突然就有人放出磁力链来,大家可以去BT下载Llama3.1 405B,包括Llama3.1 405B相关的各种测试数据,都是这么被发现的。头一天偷跑了以后,第二天梅塔说那算了,我开了吧。当时好像Llama2也是这么开出来的,现在Llama3.1 也是这么偷跑,完了以后就正式开放了。

他在跑分上已经全面地超越了GPT-4,基本上在各个指标上都超越了。这是非常非常难的,因为以前大家推出的各种模型里头,都是在个别指标里面超越GPT-4O或者超越GPT-4。那么在各项指标上全都超越的,这应该是第一次。当然了,它也是分很多版本的,分为8B、70B以及405B这三个版本。405B已经完全超越了,下面小一点的8B,应该比原来的Llama370B的效果还要再好一些。它的70B基本上针对前两天发布的GBT4OMINI,属于碾压状态。

Read More…

大家好!欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲“弱智吧”。

“弱智吧”是什么呢?它实际上是一个百度贴吧,里面有很多独特、简短的文字,带有哲学、脑筋急转弯、幽默感,甚至很优美的内容。大家会说:“我们是弱智,我们要到弱智吧里面去,贴一些弱智的内容,贴一些弱智的问题和答案。”但随着时间的积累,人们发现,这正是“大智如愚”的体现。弱智吧的很多内容也被大家筛选出来,贴到小红书、抖音等各个平台上,惊艳了一大片人。

这真是非常神奇的事情。有人感慨:“我们很聪明的人没有惊艳到别人,而是一帮‘弱智’惊艳到其他人了。”弱智吧里有些什么样的经典语录呢?比如“吃什么补什么”,告诉我们“吃苦成不了人上人,只有吃人才行”。这样的内容看似无厘头,但仔细思考,你会发现吃人才是成为人上人的唯一原因,因为“吃什么补什么”。它巧妙地结合了中国传统文化的内容。

还有其他有趣的例子:“工人罢工之后就成了人”,“原来你是工人”;“四川人至死不渝,重庆人乐不思蜀”,这两个相邻的省份和直辖市,四川人似乎到死都不愿去重庆,而重庆人却乐在其中。

Read More…
Close Bitnami banner
Bitnami