2 月 11
Luke FanAIGC, DeepSeek大模型 2025美中脱钩法案, 360智能云, AI与股市, AI云服务, AI产业链, AI产业革命, AI公司估值, AI公司分析, AI发展趋势, AI国际化, AI大模型, AI开源技术, AI开源模型, AI技术划时代, AI技术合作, AI技术壁垒, AI投资趋势, AI推理芯片, AI核心技术, AI概念股, AI模型免费, AI模型统一, AI生态统一, AI股票涨停, AI行业投资, AI革命, ASIC芯片, DeepSeek, DeepSeek R1, Deepseek V3, DeepSeek与英伟达, DeepSeek国运创新, DeepSeek影响力, DeepSeek技术解析, DeepSeek股票影响, DeepSeek部署, GPU, Josh Holy, LLaMA, TPU, 东升西降, 中国AI, 中国AI崛起, 中国AI未来, 中国移动, 京东云, 人工智能禁令, 全球AI竞争, 全球AI部署, 六小虎, 华为盘古, 博通, 国运级创新, 国运级创新意义, 国际AI格局, 大模型微调, 字节豆包, 开源大模型, 概念股, 游戏科学, 火山引擎, 百度, 百度智能云, 硅基流动, 科技公司涨停, 美股蒸发, 腾讯, 腾讯浑元, 英伟达, 金山云, 阿里云, 阿里千问, 黑神话悟空
第二个故事:DeepSeek到底是不是国运级的创新呢?国运级创新这个事呢,是游戏科学的创始人兼CEO冯骥他去讲的。DeepSeek是一个国运级的创新。游戏科学,就是黑神话悟空的这个开发商。DeepSeek呢,也确实让美股市值蒸发了很多很多钱。而且还有一位美国的参议员说:“我们要下最严格的法令来禁止DeepSeek。谁敢下载DeepSeek判20年,哪个企业敢去用DeepSeek罚1亿美金。”
这个是个共和党参议员叫Josh Holy,写了一个法案,叫2025年美国人工智能能力与中国脱钩法案。禁止技术交流与使用,禁止美国公民、企业与中国开展任何AI技术合作,包括研发、投资、数据共享等。非美国公民若涉及技术转移,可以驱逐出境。然后切断资本与人才流动,禁止美国资本对中国AI企业投资,并限制美籍科研人员参与中国AI项目。任何与中国高效实验室合作的美国机构将面临重罚。违反本法案的个人将被视为严重犯罪分子,可能影响其移民身份、绿卡申请和入籍资格。美国公司不能直接或间接向中国企业提供AI技术支持或者服务。但是这个法案呢,因为太过极端已经被搁置了。
先讲一下使用DeepSeek的方式到底是什么样的。如果你在美国使用DeepSeek,那千万千万不要去DeepSeek网去挂,那是根本得不到服务的。最好是什么呢?就是去在美国的云主机上去使用。现在DeepSeek自己的网站基本上是半瘫痪状态,聊两句就趴菜。我基本上是第一句能聊,第二句能聊,第三句你再怎么跟他聊都趴。他是这样的一个状态。你可能明天再跟他聊,还可以聊两句。API调用的话非常非常慢。而且呢,现在禁止充值了。整个春节期间,API调用的这个页面就打不开了,把整个API后台给你封掉了。现在的话是后台重新有了,但是不允许充值。现在呢,国内是各种云上都有,国内的是阿里云、腾讯云、华为云。华为云的DeepSeek呢。
More
7 月 25
Luke FanAIGC, Meta的故事, OpenSource 405B版本, AI上下文窗口, AI事实标准, AI产业方向, AI产业链, AI偷跑事件, AI公司发展, AI创新挑战, AI创新推广, AI功率需求, AI协议限制, AI商业机会, AI商业模式, AI多模态, AI多语言支持, AI宏大模型, AI市场分析, AI应用前景, AI开源协议, AI性能测试, AI性能超越, AI技术合作, AI技术商业化, AI技术应用, AI技术投资, AI技术支持, AI技术突破, AI技术革新, AI显卡需求, AI未来趋势, AI标准化, AI模型优化, AI模型开放, AI模型电费, AI法律框架, AI生态价值, AI生态系统, AI生态系统发展, AI硬件需求, AI磁力链, AI空调耗电, AI能耗问题, AI行业分析, AI行业动态, AI行业趋势, AI计算能力, AI训练成本, AI训练数据, AI训练时间, AI语言支持, GPT-4对比, GPT-4跑分, HIKING face数据集, LLaMA, Llama 3.1, Llama 3.1 405b, Together AI, 中国AI厂商, 中国AI厂商冲锋, 中美科技博弈, 多模态支持, 开源与闭源, 拉玛模型争议, 梅塔与中国, 梅塔公司, 模型微调
Llama3.1 405b突然开放,指标上全面超越GPT-4。中国厂商们是不是又可以充了呢?大家好,这里是老范讲故事的YouTube频道。今天咱们来讲一讲Llama3.1 405b 开放的事情。
Llama的开放,每一次都比较有戏剧性,都会有偷跑。什么叫偷跑?就不是由官方开了发布会,说我今天发布了一个什么产品,而是一般都是在Reddit这样的论坛里,突然就有人放出磁力链来,大家可以去BT下载Llama3.1 405B,包括Llama3.1 405B相关的各种测试数据,都是这么被发现的。头一天偷跑了以后,第二天梅塔说那算了,我开了吧。当时好像Llama2也是这么开出来的,现在Llama3.1 也是这么偷跑,完了以后就正式开放了。
他在跑分上已经全面地超越了GPT-4,基本上在各个指标上都超越了。这是非常非常难的,因为以前大家推出的各种模型里头,都是在个别指标里面超越GPT-4O或者超越GPT-4。那么在各项指标上全都超越的,这应该是第一次。当然了,它也是分很多版本的,分为8B、70B以及405B这三个版本。405B已经完全超越了,下面小一点的8B,应该比原来的Llama370B的效果还要再好一些。它的70B基本上针对前两天发布的GBT4OMINI,属于碾压状态。
More
5 月 06
Luke FanAIGC AI和文化的交融, AI大模型, AI技术应用, AI挑战, AI模型效果, AI模型训练, AI的文化影响, AI的未来, AI研究, AI训练, English, GPT-4, LLaMA, 中文语料, 中文语料库, 中科院, 人工智能, 人工智能教育, 人工智能测试, 人工智能的智慧路径, 人类创造力, 内容创作, 哲学, 哲学思考, 哲学的现代应用, 哲学语录, 图灵测试, 大数据训练, 大智若愚, 大模型训练, 小红书, 幽默, 幽默与哲学, 幽默哲学, 幽默文化, 开源数据, 开源数据集, 开源贡献, 开源资源, 弱智8, 弱智吧, 技术影响, 技术解读, 抖音, 教育科技, 数据开放, 文化现象, 文化评论, 文字游戏, 文心一言, 智慧体现, 机器学习, 机器智慧, 模型优化, 模型微调, 滑铁卢大学, 百度贴吧, 社交媒体互动, 社会文化, 科技与文化的桥梁, 科技创新, 科技发展, 科研成果分享, 简体中文, 繁体中文, 编程能力, 编程逻辑, 网络传播, 网络幽默, 网络幽默的力量, 网络文化, 网络热点, 网络社区, 网络趣味分析, 脑筋急转弯, 训练数据集, 语料库, 语料训练, 语言模型, 语言的力量在AI中的应用, 语言艺术, 跨界影响, 逻辑分析, 逻辑思考, 逻辑挑战, 逻辑推理, 零一万物, 高质量语料
大家好!欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲“弱智吧”。
“弱智吧”是什么呢?它实际上是一个百度贴吧,里面有很多独特、简短的文字,带有哲学、脑筋急转弯、幽默感,甚至很优美的内容。大家会说:“我们是弱智,我们要到弱智吧里面去,贴一些弱智的内容,贴一些弱智的问题和答案。”但随着时间的积累,人们发现,这正是“大智如愚”的体现。弱智吧的很多内容也被大家筛选出来,贴到小红书、抖音等各个平台上,惊艳了一大片人。
这真是非常神奇的事情。有人感慨:“我们很聪明的人没有惊艳到别人,而是一帮‘弱智’惊艳到其他人了。”弱智吧里有些什么样的经典语录呢?比如“吃什么补什么”,告诉我们“吃苦成不了人上人,只有吃人才行”。这样的内容看似无厘头,但仔细思考,你会发现吃人才是成为人上人的唯一原因,因为“吃什么补什么”。它巧妙地结合了中国传统文化的内容。
还有其他有趣的例子:“工人罢工之后就成了人”,“原来你是工人”;“四川人至死不渝,重庆人乐不思蜀”,这两个相邻的省份和直辖市,四川人似乎到死都不愿去重庆,而重庆人却乐在其中。
More