硕鼠的博客站

范路的博客主站,时而会发些东西。

Posts Tagged ‘多模态训练’

大家好,欢迎收听老范讲故事的YouTube频道。今天我们又请到了老朋友尹迪狗,给我们介绍一下刚刚召开完的谷歌艾欧。这一次到底发布了什么。而在谷歌艾欧之前的一天,OpenAI我觉得算是故意捣乱截胡,发了个GP4欧出来。我们就正好趁这个时机呢,把这两个发布会或者两两个产品吧,一起来总结一下。首先呢,我想先问一下,GBT4O到底算不算是划时代的产品。嗯,至少模型啊,分成两部分,它发的是PPT是o是模型混合模态嘛,他把语音视频和文字一块训练的嘛,可以同时输入和输出嘛。这个相当于是,嗯,也不叫划时代吧,就是他之前所有的工程技术的沉淀。嗯然后呢,做了一个特别好的一个交互形式,就是语音交互。而且那个语音交互的很大一个特点,发完之后不是马上就有人升级吗,一搜我的这个APP上面的模型以及GPT,搜了然后大家都想打开。那那个耳机,点上去之后呢,可以跟他聊聊天。实际上,那个聊天并不是他发布会上的那种APP,那个还是回合制的,用那个rest接口聊天。我,发出去然后回来,这个回合制的,但是呢,他在发布会上演示的是完全stream的,就是像就像我们现在一样,我们录节目,我们用的是Web RTC协议嘛,streaming,就是你的Server端,它的那个TOKEN,它就不停的接收是吧,做实时处理。这个特别耗流量,耗TOKEN,耗算力的。嗯现在还没用到这个模型,所以大家感受不到,所以我记得第二天还第三天的时候m奥特曼还是他们官方账号,发了一个说明嘛,说哎你们大家用的现在还不是,发布会上也是这个,哈哈哈,一堆人说说这一直完完全不对,这么慢的响应,我觉得借手报了一下,就是他是非常natural,非常自然。可能就是大家第一次用起来 GPT 的感觉,一样哎。哇哦,是他没这样回答问题。就是他确实是有那个时候的一个感觉。

Read More…
Close Bitnami banner
Bitnami