11 月 13
Luke FanAIGC 4D空间智能, AI发展方向, AI教母, AI的下一个前沿, Fei-Fei Li, LLM局限性, World Labs, 世界模型, 交互式AI, 人工智能, 具身智能, 内容创作, 大型语言模型, 推理, 时序一致性, 机器人技术, 李飞飞, 物理世界, 物理感知, 状态预测, 生成式AI, 科学发现, 科技评论, 空间智能, 视频生成, 计算机视觉
李飞飞的万字长文,讲述空间智能的未来
大家好,欢迎收听老范讲故事的YouTube频道。
李飞飞呢,最近发了一篇文章,指出AI的下一个方向。AI的下一个发展方向就是空间智能。这个文章呢是11月11日发表的,非常非常长,上万字。标题呢是《从词语到世界:空间智能是AI的下一个前沿》。教授的长文,读起来还是稍微有一点点吃力,我还是认真地把整个文章读完了。教授呢,未必能够准确预测未来,那是算命先生的工作。但是,教授对未来的预测,还是值得认真研读一下的,特别是这位教授,还是当前AI浪潮的开拓者之一。
文章的结构之美:值得学习的写作范本
第一个特点就是非常的工整。她的文章结构,大家需要去学习一下。哪怕你说我看不懂这文章说什么,还是应该学习一下人家文章怎么写的。上来第一件事是提出问题:现在有些什么样的问题?然后呢,是核心概念的一些解释,对吧?啥叫空间智能?再往后呢,是方法论的一个架构:我准备怎么干?然后呢,是技术实施的一些细节和方法。最后呢,是应用的路径:我这个实施了以后能干嘛使?它是这样的一个完整架构。
每一个大标题下面呢,会有3到5个小标题,每个小标题下面,均匀地分布着描述和说明。它不会像有些人写文章,在某一个小标题下写非常长的内容,其它的显得干巴巴的,不会是这样的,很均匀。学习一下教授的写作方法,还是非常非常有价值的。
More
11 月 29
范, 路AIGC AI工具, AI应用, DALL-E 3, Hugging Face, Open AI, SEO优化, Sora大模型, Turbo版本, 业内动态, 互动媒体, 产品发布, 人工智能, 企业创新, 企业合作, 保密协议, 公关策略, 内容优化, 内容匹配, 内容变现, 内容审核, 内容生成, 内容策略, 内容质量, 创意合作伙伴, 创意平台, 动态内容, 可控性, 品牌保护, 图像生成, 在线工具, 在线编辑工具, 媒体传播, 媒体内容, 媒体整合, 媒体营销, 实时生成, 宣传策略, 市场趋势, 平台发展, 平台生态, 开发者社区, 开源合作, 影视行业, 技术产业, 技术创新, 技术对比, 技术开发, 技术挑战, 技术突破, 挑战与机遇, 效果展示, 数字人, 数字媒体, 数据处理, 数据安全, 未来科技, 模型参数, 模型训练, 法律风险, 深度学习, 版权纠纷, 生成模型, 用户交互, 用户体验, 知识产权, 社交媒体策略, 社交影响, 算力成本, 线上互动, 自动化处理, 艺术家, 艺术表现力, 行业先锋, 覆盖范围, 视觉创意, 视觉效果, 视频内容, 视频安全性, 视频模型, 视频流, 视频特效, 视频生成, 视频生成技术, 视频生成潜力, 视频编辑, 视频风格, 计算机视觉, 语音合成, 跨平台使用, 跨文化传播, 身份验证, 高成本
昨天,Sora短暂的泄露。但是,我们真的还需要等待Sora吗?大家好,欢迎收听老范讲故事的YouTube频道。在今年2月份,Open AI公布了他们的Sora大模型之后,大家一直在等待这个产品的正式发布。但是,等到了现在,已经到年底了。很多跟随Sora的产品都已经上线,都已经有很多用户开始使用了,Sora自己还遥遥无期。
在这样的一个时间点里,突然有一群艺术家将Sora的这个接口公开到了Hugging Face上面去,短暂的开放了一段时间。这些艺术家呢,还发表了一封公开信,表达了自己对于Open AI的各种剥削的不满。Open AI呢,及时发现,在一小时之后封闭了接口,说你们就到这吧;然后也出来做了一些解释,表示这些艺术家们都是跟我们一起去合作的,他们都是自愿参加的,没有什么强迫。大概也是讲了一些这种片汤话。
至于Sora什么时候能发布,人家也没有再继续提供更进一步的信息。那么,这一次泄露出来的呢,是Sora的Turbo版本。Turbo是轻量级快速的版本,就是不是一个全尺寸的模型,参数呢也并不是很突出。2月份,Sora当时号称自己是世界模型,可以仿真出世界来的,当时是可以出一分钟的视频的。虽然一分钟视频并没有那么大的用处,超过一分钟都属于超长镜头,电影里头用这种镜头其实也不是那么多。这一次呢,只提供了1080P、720P、360P三种的分辨率,然后时长呢就是5到10秒钟。其实跟我们现在可以使用到的大量的这种视频生成模型参数是一样的,现在的视频生成模型基本上都是5到10秒钟。
More