10 月 28
Luke Fan 中国故事 BAT , CDN , CDN许可证 , FSD , ICP许可证 , ICP证书作用 , IDC , ISP , SP许可证 , VIE架构 , VPN , 上海 , 云计算 , 互联网出版 , 互联网增值服务 , 互联网增值服务开放 , 互联网政策 , 互联网视听许可证 , 信息交互 , 信息保护 , 信息发布 , 信息搜索 , 信息服务 , 内容分发 , 内容提供商 , 北京 , 在线数据处理 , 外商投资 , 外资企业 , 外资进入中国市场 , 安全合规 , 宽带接入 , 宽带服务 , 广播电视制作 , 微软 , 技术创新 , 授权许可 , 搜索引擎优化 , 政府政策调整 , 海南 , 海外投资 , 深圳 , 游戏公司 , 特斯拉 , 电信与信息服务 , 电商平台 , 网易 , 网络实名制 , 网络文化经营 , 腾讯 , 自建机房 , 许可证改革 , 证书申请 , 试点城市 , 谷歌
VIDEO
10月23号,突然发文,互联网增值服务对外开放了,特斯拉第一个上来申请。这到底是什么样的情况?大家好,这里是老范讲故事的YouTube频道,今天咱们来讲一讲,到底啥是互联网增值服务,这一次都开放了一些什么东西。
互联网增值服务呢,指的是利用互联网通讯、网络资源和互联网技术,在基础的互联网接入服务、信息服务之上,通过深度加工、开发和整合等方式,为用户提供具有额外价值的服务。这个呢是一个基本的解释。你说你这说的好像是一堆废话。
互联网增值服务里头,有一个比较核心的证书,叫ICP证书。咱们国内就是你做各种服务,就需要申请各种各样的许可证。ICP许可证呢,叫电信与信息服务业务经营许可证。但是呢,这一次给外资开放的,仅仅是互联网信息服务业务,其他的并没有开放。
More
10 月 21
Luke Fan AIGC , 芯片的故事 AIGC行业 , AI企业战略 , AI企业生存 , AI企业竞争 , AI发展趋势 , AI商业价值 , AI商业化 , AI大模型 , AI工具 , AI市场分析 , AI市场前景 , AI市场变化 , AI市场策略 , AI市场需求 , AI应用 , AI应用方向 , AI技术创新 , AI技术趋势 , AI投资 , AI未来发展 , AI桌面应用 , AI泡沫 , AI芯片 , AI行业分析 , AI行业动态 , AI行业崩盘 , AI行业挑战 , AI行业未来 , AI行业机遇 , AI行业洗牌 , AI行业洞察 , AI行业现状 , AI行业痛点 , AI行业观察 , AI行业转型 , AI裁员 , Anthropic , GPU租赁 , H100租金 , Kimi , OpenAI , ToB , ToC , 个人用户 , 云计算 , 光刻机 , 创投 , 台积电 , 商业模式 , 商业模式创新 , 商业用户 , 大企业裁员 , 大模型同质化 , 大模型训练 , 字节跳动 , 存储市场 , 市场洗牌 , 市场预期 , 开源模型 , 手机需求 , 投资 , 投资者心理 , 泡沫破裂 , 电脑需求 , 盈利 , 算力卡 , 算力需求 , 股市震荡 , 自由职业 , 自由职业者 , 芯片市场 , 英伟达 , 行业迷茫 , 行业重组 , 行业预测 , 订单减少 , 谷歌 , 财报泄露 , 郁金香时刻 , 阿斯麦 , 阿里
VIDEO
大家好,这里是老范讲故事的YouTube频道。我们现在开始讲第一个故事:阿斯麦崩盘。
是不是AI大模型要迎来郁金香时刻?什么是郁金香时刻?就是我们认为有一个大的崩盘即将到来的时候,我们管它叫郁金香时刻。因为当年荷兰人去卖郁金香的时候,就遇到了郁金香崩盘这样的事情。后面每一次大的这种泡沫破裂的时候,你可以认为它是一个郁金香时刻。
那么阿斯麦是怎么崩盘的呢?算是意料之外,情理之中。为什么叫意料之外呢?因为由于某个技术原因或者某一个技术故障,导致了应该是晚一天发布的财报提前一天泄露了。但是呢,这个泄露出来的财报并不是说虚假的或者说有错误的,就是正确的财报,只是他看到的时间稍微早了一点,或者是大家意料之外的这个时间看到了。早看到一天、晚看到一天,里面的数据都不会发生任何变化。
More
9 月 09
Luke Fan AIGC 2000美元每月 , AIGC , AI发展 , AI算法 , Anthropic , API , ChatGPT , Gemini , Information , iPhone良品率 , OpenAI , OpenAI团队 , Orin猎户座模型 , Q星算法 , Scaling law , TOKEN费用 , 上市 , 主权大模型 , 云计算 , 人工智能 , 人才招聘 , 价格上涨 , 传闻 , 信息传播 , 印度制造 , 合成数据 , 合成数据训练 , 商业合作 , 商业模式 , 国有化 , 大模型 , 大模型训练 , 安全成本 , 富士康 , 幻觉 , 微软 , 拉玛模型 , 数据处理 , 数据枯竭 , 数据清理 , 数据生成 , 显卡 , 显卡销售 , 未来展望 , 未来方向 , 模型成本 , 盈亏平衡 , 盈利模式 , 科技创新 , 科技媒体 , 科技新闻 , 科技趋势 , 算力中心 , 算力成本 , 英伟达 , 草莓算法 , 融资 , 行业分析 , 行业领导者 , 谷歌 , 连年亏损 , 高智商犯罪 , 黄仁勋
VIDEO
2,000美元一个月的ChatGPT还会有人用吗?
大家好,这里是老范讲故事的YouTube频道 。
今天咱们来讲一讲OpenAI有可能给ChatGPT涨价的事情。消息哪来的?国外著名科技媒体Information上报道,OpenAI因为连年的亏损,而且新的模型成本快速上涨,所以有可能给ChatGPT涨价。涨多少呢?他们也是搜集了很多的信息以后,判定有可能会涨到100倍,也就是2,000美元一个月。这是不是幻觉呢?大概率是。
那你说Information上面怎么会有幻觉呢?需要注意,Information上面也是说,我们根据各种信息总结出来以后,有一种声音提到有可能会涨100倍。具体是哪个涨100倍并没有说。到底是每个月这个20美金的订阅费用涨100倍,还是说TOKEN的费用,或者其他的一些商业合作的费用,涨到100倍都没有说。而到底是涨100倍,还是说按照这样的一个级别去涨,现在也没有讲清楚。所以只是说,我们根据传言得到了这样的一个消息,这就算是一个幻觉。
咱们再讲一个幻觉的故事。前面有人提到,印度产的iPhone良品率只有50%。后来被富士康的人出来辟谣,说没有那么差。如果良品率只有50%,苹果也受不了。其实印度产的iPhone良品率比中国的低10%。郑州富士康的iPhone良品率大概是96%,印度大概是85%或者86%这样的一个水平,其实依然是可以接受的。
More
9 月 06
Luke Fan AIGC , 英伟达,黄仁勋的故事 4090显卡 , A800显卡 , AIGC , AI差距 , AI进步 , B W 200 , BAT , Blackwell芯片 , Daniel Naily , EFC , GPU采购 , H20显卡 , H800显卡 , IBM , IOE , Oracle , Scaling law , SemiWiki , 中国企业 , 中国电信 , 中国移动 , 中美AI对比 , 云计算 , 云计算机房 , 人才 , 光缆 , 全球GPU市场 , 半导体自媒体 , 半导体行业 , 华为 , 台湾 , 台湾显卡市场 , 合规成本 , 商业逻辑 , 大基建 , 央企 , 字节跳动 , 小公司 , 巨头 , 带宽资源 , 应用场景 , 微信聊天记录 , 技术升级 , 技术维护 , 政府拨款 , 政策解读 , 数据中心 , 数据中心建设 , 数据训练 , 数据质量 , 文学作品 , 新加坡 , 新加坡显卡购买 , 显卡需求 , 比较优势 , 电信运营商 , 百度 , 短视频 , 算力云 , 算力分散 , 算力卡数量 , 算力市场 , 缩放法则 , 美云计算 , 腾讯 , 英伟达显卡 , 英伟达股价 , 资源整合 , 转租显卡 , 阿里云
VIDEO
到底有哪些企业在购买英伟达的显卡?这个跟大家想象的可能不太一样。中国只有这些显卡吗?跟大家想的可能也不太一样。另一方面,中美之间的AI差距到底在什么地方?
大家好,这里是老范讲故事的YouTube频道。最近网上流传了一张图,直接把大家给看懵了。这张图写的是什么呢?就是到底哪些数据中心买家在买英伟达的显卡。我们不算是大家打游戏去买4090,或者是普通的一些小公司买了一堆4090去干活,这不算。我们算的是数据中心的,这到底是什么人在买?
在这个图上显示,在2023年Q2、Q3到Q4,实际上每一个季度,中国人从英伟达买的显卡数量都是快速上升的。到2024年呢,有所下降。2024年Q1的话,大概比2023年的Q2还要再少一些,但是到Q2继续在上升,应该是达到2023年Q2的一个同等水平了。
More
7 月 28
Luke Fan AIGC Aceropic Cloud 3.5 Sonnet , API销售 , ChatGPT , GPT-4 Mini , GPT-5发布 , GPT5 , GT5推出 , iPhone 16发布会 , Microsoft OpenAI合作 , OpenAI , OpenAI Plus , OpenAI估值 , OpenAI压力 , OpenAI发展策略 , Redit , Steal the home , 上市计划 , 云服务成本 , 云计算 , 亚马逊因素 , 人员成本 , 估值 , 商业模式创新 , 大模型之争 , 小模型调试 , 市场份额 , 市场机制 , 市场竞争分析. , 市场策略 , 市场验证 , 开放AI生态系统 , 开源模型 , 微调与RAG , 微调免费 , 微软 , 微软销售策略 , 投资风险 , 拉玛3.1405B , 数据处理 , 新兴竞争者 , 新技术应用 , 未来科技趋势 , 核心竞争力 , 梅塔 , 模型训练 , 特斯拉案例 , 研发经费 , 竞争力提升 , 竞争激烈 , 端到端语言训练模型 , 苹果 , 融资需求 , 行业前景 , 行业开拓 , 行业新趋势 , 行业规范 , 行业震荡 , 计算成本 , 谷歌 , 谷歌I/O , 高性能计算 , 高质量训练数据
VIDEO
GPT5如果再不出的话,可能就没有机会了。大家好,这里是老范讲故事的YOUT5频道。今天咱们来讲一讲OpenAI现在身上的压力到底有多大。再不出GPT5,可能真的要出事儿了,因为前面吹过的牛实在太多了,特别是Sola这样的模型,号称可以直接生成长的视频出来,到现在已经半年了,还没有真正拿出来,只是每个月放出几个视频而已。而其他各个公司,按照Sora方向做的产品,已经都开始在公众测试了,这对他们来说一定是巨大的压力。
前一段时间发布的Anthropic Claude 3.5 Sonnet,也把压力给到了OpenAI,因为这个模型的效果已经非常好,而且极其便宜。更不要说昨天刚刚发布的Llama3.1405B这样的一个开源模型。前面咱们讲的Anthropic的模型还是闭源的,而Llama可是个开源模型。405B的话,在各个层次上,都赶超了OpenAI的Chat GPT-4。老大的位置有可能会丧失。
More
7 月 15
Luke Fan 中国故事 GFW , IPv4 , IPv6 , Ipv6安全 , IPv6普及 , IP地址 , NAT , 上网隐私 , 临时IP , 临时IP变更 , 临时IP地址 , 云计算 , 互联网 , 互联网安全 , 互联网设备 , 全球网络 , 去NAT , 固定IP , 地址封堵 , 域名解析 , 安全网络 , 安全问题 , 家庭宽带 , 家庭网络安全 , 工业和信息化部 , 工信部 , 技术变迁 , 技术革新 , 新技术应用 , 智能家居 , 智能家庭设备 , 智能设备 , 流量提升 , 物联网 , 电信企业 , 网信办 , 网络互联 , 网络信号 , 网络协议 , 网络发展 , 网络变革 , 网络地址 , 网络地址转换 , 网络基础设施 , 网络安全 , 网络安全措施 , 网络安全策略 , 网络封堵 , 网络应用 , 网络技术 , 网络控制 , 网络支撑 , 网络新技术 , 网络新规 , 网络更新 , 网络服务升级 , 网络服务提供商 , 网络未来 , 网络架构 , 网络流量管理 , 网络环境 , 网络监控 , 网络管理 , 网络设备 , 网络设备管理 , 网络访问 , 网络资源 , 网络运营商 , 网络追踪 , 网络通信 , 网络部署 , 网络配置 , 网络链接 , 网络防护 , 网络隐患 , 网络隐私 , 网络隐私保护 , 设备安全 , 设备安全性 , 设备更新 , 路由器 , 路由器设置 , 软件更新 , 防火墙 , 防火墙设置
VIDEO
大家好,欢迎收听“老范讲故事”的YouTube频道。今天,咱们来讲一讲工信部要去NAT啊,GFW是不是会有一些新的变化。这是什么时候的消息?7月10号的消息。工信部网站上发了一篇文章,说两个单位开会了,是工业和信息化部办公厅以及中央网信办秘书局。这俩单位开了什么会呢?就是网络去NAT专项工作会。这个会上讲的是什么呢?就是要加快IPV6的部署啊,规模以及流量的提升。
那么,到底啥是NAT啊?NAT是一个英文缩写,叫network address translation,就是网络地址的转换。为什么会有这样的一个东西呢?咱们一般的网络地址呢,叫IPV4,就是由四个数组成的,每个数呢,四位这种数呢,他不够读。其实现在的IPV4的地址已经分配光了。啊,那你说不对啊,我新买个手机没说上不了网啊,我新买个电脑也没说上不了网啊,对吧,怎么就分配光了呢?哎,这个里边就使用了这种叫NAT的技术。
什么意思啊?咱们以家里头为例啊,家里有一路由器,把路由器呢,通过拨号到中国联通、中国电信、中国移动啊,到这个地方去分配到了一个地址。但这个地址啊,是个临时地址啊,它是通过PPP OE啊或通过什么样的方式拨号拨上去的。你家里边的所有什么电脑啊、手机啊、平板啊,它通过这个路由器,进行Nat转换了以后,再去上网。对于网站来说,你访问了一个网站,访问了一个APP,那么他只知道什么呢?是你家这个路由器的IP地址是什么。
More
6 月 27
Luke Fan AIGC AI技术 , GPT , HR并购 , IT支持 , Linux端 , Mac端 , Mulit , Open AI , Rockset , ROXDB , ToB市场 , ToC市场 , Windows端 , 买买买模式 , 云计算 , 产品化战略 , 产品研发 , 人才并购 , 人机互动 , 企业并购 , 企业战略 , 创始团队 , 创投圈 , 商业模式 , 多团队协作 , 多用户协作 , 大数据 , 存储引擎 , 实时数据查询 , 密码学 , 市场拓展 , 开发者友好 , 开发者工具 , 开源技术 , 战略调整 , 技术创新 , 技术合作 , 技术收购 , 技术整合 , 技术竞争力 , 投资回报 , 投资策略 , 搜索引擎 , 搜索结果优化 , 操作系统 , 收购 , 效率提升 , 数据分析 , 数据压缩 , 数据合规性 , 数据处理 , 数据处理效率 , 数据存储 , 数据安全 , 数据库 , 数据库管理 , 数据检索 , 数据爬虫 , 数据管理工具 , 数据锁引 , 数据隐私 , 智能操作系统 , 桌面环境 , 模型调整 , 用户体验 , 用户界面 , 矢量搜索 , 科技产业 , 科技创新 , 科技发展方向 , 科技巨头 , 科技市场。 , 科技融资 , 股份交易 , 股票收购 , 股票期权 , 行业竞争 , 软件开发 , 远程工作 , 远程控制 , 远程桌面管理 , 高性能查询
VIDEO
大家好,欢迎收听“老范讲故事”的YouTube频道。今天,咱们来讲一讲OpenAI,也开启了“买买买”模式。什么是“买买买”模式呢?就是一家公司开始不停地进行并购,快速、集中地开始进行收购。这叫“买买买”模式。OpenAI在过去的一周里头,连开两枪,也就是说,OpenAI在过去一周里头,连续收购了两家创业公司。哎,这也是说它现在开始改变战略了。
这两个公司呢,一个叫Rockset,啊,ROCKSET,这是由两名印度裔的前Facebook员工创立的数据库公司。据说呢,是一个上亿美元的交易。为什么是据说呢?因为这种交易通常是保密的啊,待会儿我们来讲为什么。
另外一个呢,叫Multi,啊,MULTI,啊,是多个这个意思。这个公司呢,是一家位于纽约的,只有五个人的小团队。他们呢,做远程桌面管理的,估计呢,应该也是上亿美金的一个交易。具体交易细节保密。
More
6 月 04
Luke Fan AIGC , 英伟达,黄仁勋的故事 1.8万亿参数 , 2.7万亿美金 , AI , AIPC , AI工厂 , AI工厂时代 , AR , Blackware , COMPUTEX , GPT-4 , GPT4 , GPU , GPU技术大会 , GPU核心 , GTC , H1 , H100 , MoE , NVIDIA , NVlink , RTX , scoring low , SERVER , stable diffusion , TOKEN , TX , VR , 云计算 , 人工智能 , 内存 , 军备竞赛 , 分析 , 参数 , 参数量 , 台积电 , 合作伙伴 , 商业 , 垄断地位 , 大模型 , 工程师 , 市值 , 应用开发 , 开发者 , 微软 , 戴尔 , 技术大会 , 投资人 , 推理 , 推理能耗 , 支架 , 数据中心 , 显卡 , 机器人 , 机箱 , 模型 , 模型训练 , 游戏助手 , 版本 , 生态链 , 用户 , 硬件 , 科技 , 移动互联网 , 竞争 , 竞争对手 , 竞争者 , 算力 , 算力成本 , 算力芯片 , 缩放定律 , 股价 , 能耗 , 芯片 , 英伟达 , 苹果 , 行业秘密 , 计算机 , 计算机大会 , 训练能耗 , 设计 , 谷歌 , 贷宽 , 超威 , 车载芯片 , 软件 , 铁皮 , 黄仁勋
VIDEO
大家好,欢迎收听老范讲故事YouTube频道。今天,咱们来讲一讲黄仁勋在COMPUTEX上的狂欢。COMPUTEX是一年一度在台湾举行的计算机大会。黄仁勋,作为现在真正AI时代的当红炸子机,可能是唯一靠AI赚了大钱的人。虽然微软也在赚钱,但是微软整个靠AI挣的钱并没有那么多。真正靠AI赚了大钱的公司只有他一家——英伟达。刚才我看了一下,英伟达现在市值2.7万亿美金。大家知道,再往前就是微软的3.2万亿,第二名是苹果,2.9万亿,还差那么一点点。可能稍微一哆嗦,英伟达就有可能成为世界第二市值的公司了。那么,黄仁勋上面都讲了什么呢?作为网红,肯定还要先暴露一下行业秘密,别人都不知道他知道的事情。上来先说一下他现在讲的是什么——就是GPT-4到底有多少参数。GPT-3.5大家知道是1,700多亿参数,就是一个170多亿级别的模型。但是到GPT-4的时候,OpenAI就再也没有出来说它到底有多少参数。很多人说你是不是超过万亿了,对OpenAI来说,这个数据不是很准确。我来辟谣了,但是具体有多少,从来没有讲过。黄仁勋在前面的GTC,就是GPU技术大会上,每年一次的英伟达自己的开发者大会上,上面也讲了……
说起来1.8T,这个1.8T指的是什么呢?其实就是1.8万亿参数,而且它是一个Moe模型。当时OpenAI并没有对此多说什么,但这一次,在《Computer Text》上,他们又反复强调了这个事情,明确指出GPT-4的训练参数达到了1.8T。这让人们意识到,想要达到GPT-4的水平,还有很长的路要走。尽管现在大家都在努力研发号称能达到或接近GPT-4水平的模型,比如几百亿参数的模型,比如梅塔的拉马3可能会有一个400亿参数的模型,国内也出现了很多一两百亿参数的模型。但事实是,即使提到的1.8T参数,如果考虑到是Moe模型,分成八份来看,那么单个模型可能也就相当于200多亿参数的水平。
More
6 月 04
Luke Fan AIGC AI , AIGC , AI芯片自主研发 , AMD , DC新动向 , Gemini , GPT Plus , GPT-4 , GPT-4o , GPT-6 , GPT4 , GPTS , GPU , H100 , H100算力卡 , iOS 18 , iOS18 , iPadOS18 , M2 Ultra , M2Ultra性能 , Mac Studio , MRUltra芯片应用 , OpenAI , Siri , TOKEN收费 , WWDC , WWDC2024展望 , 中国市场 , 乔布斯 , 云计算 , 产品更新策略 , 人工智能 , 付费用户 , 企业权力结构 , 免费开放 , 内存带宽需求 , 内部决策 , 功能扩大 , 合作伙伴关系 , 图像处理 , 图像识别 , 多模态 , 多模态AI模型 , 多模态交互 , 大模型 , 大模型训练 , 天威不可测管理 , 定制开发 , 对话框 , 市场竞争分析 , 技术合作风险。 , 技术规范设定 , 挤牙膏 , 推理任务 , 提姆库克 , 数据中心建设 , 斯嘉丽约翰逊 , 显卡 , 未来趋势预测 , 本地设备限制 , 李开复 , 百度 , 盛大创新院 , 端到端 , 算力中心 , 统一内存 , 翻车 , 英伟达 , 苹果 , 行业标准 , 行业标准制定者 , 计算器 , 计算器争议 , 训练大模型 , 诉讼 , 语音功能 , 语音识别 , 调用频率 , 谷歌 , 迁移成本 , 销量增长
VIDEO
大家好,欢迎收听老范讲故事YouTube频道。今天咱们来讲第一个故事。Open AI进一步开放了GPT-4欧的免费功能和范围,留给苹果的时间真的不多了。所以,这一个话题里我们会讲两件事。
第一个是Open AI进一步开放了很多免费用户可以使用GPT-4,主要是4欧了。另外呢,就是苹果现在的日子并不好过。虽然我们前面反复在想说,大家万众瞩目,万众期待WWDC,6月5号吧,大家都在等这一天。但是,呃,越是大家期待的事情,可能最后啊,越让大家失望。
最近Open AI呢,肯定是消息不断。为什么呢?山伯特曼本人是一个呃,政客或者说他政治手腕非常的强大。前面闹出了很多的负面,比如说伊利尔走人,超级队旗团队的负责人走人,而且这两天呢,超级队旗那个负责人已经去了anceropic,还在跟瓦解,也就是斯嘉丽约翰逊才在这打着官司。各种的负面都很多,所以呢,一定会放出很多消息来,去纠正这些负面信息啊。
More
12 月 08
Luke Fan 梦想园 云计算 , 梦想园
今天在http://openpk.org 上的 #盛大云计算大赛# 创意投递中,看到了一个非常有趣的创意,叫做Face-API。其实前几天 @孤云大兵 同学提交创意“明星脸”时还有人在评论“这个技术门槛不低,要如何实现相关技术”的问题?当时孤云大兵表示准备去看一看论文,找一些相关的算法,不料今天就有人直接送服务上门了,真是无巧不成书。
• Face-API 的介绍
Face-API是基于云主机提供的一套实现人脸识别服务的开放API。
Face-API的工作方式是这样的:首先,调用这套API的应用要将照片上传到云端;然后Face-API会在云端进行人脸检测,即使是合影,只要人脸所占像素达到了识别的标准,就会被一一检测出来;检测到人脸之后,根据五官的角度和比例来判定人脸在照片中的角度;最后一件事情就是进行人脸聚合,计算机是无法判定哪张脸属于哪个人的,它能做的仅仅是将同一个人的人脸聚集在一起。
Face-API将聚合的信息发送给调用它的应用,然后就会删除上传到服务器的照片,仅仅保留下聚合之后的人脸特征信息。当下次该应用再传输照片上来的时候,只需要和留存的人脸特征信息库进行比对,就可以知道这些新照片中哪些人脸以前曾经被识别和聚类过,并再次进行聚类。
到此为止,计算机能做的事情已经结束,操作权再次交回用户手中。也就是说,用户要自己将识别出来的聚类与具体的人关联起来,以及进行少量识别结果的校对。在这个人工参与环节之后,才算是完成了人脸识别的完整过程。
在此之后,应用还应该将用户反馈的信息(尤其是如不同聚类其实是同一个人、或某个聚类中有个别照片有误)反馈给Face-API服务器,以便服务器对算法进行校正,以提高今后继续识别的精确性。
当然,这并不是一个完全的训练过程。比如一个儿童,随着年龄的增长,其相貌变化是很大的,就算是人隔上几年看到一个儿童也不一定能够认出来,对于计算机系统来说,能够做的也就是记住“这是某某人,那也是某某人”,足矣。
上面解释的是最基本的服务流程,真正使用起来还要略微复杂一些。Face-API除了能够提供基本的人脸检测功能之外,还准备提供相似度比较、性别判定及年龄判定等,以后应该还会不断添加新功能进来。
• Face-API 的用户隐私保护
如果需要进行人脸检测,就必须要上传照片。但是对于Face-API来说,系统并不知道这些照片上的人具体是谁,只是会进行人脸聚集。应用不断地传照片上来,Face-API服务器只能知道这次传上来的照片中有某个人脸和以前传上来的某个很像。
当用户将某张照片与某个人进行关联之后,这个数据并不会上传到Face-API服务器。对于Face-API来说,某一个聚类的照片,所指向的那个用户永远都是一个唯一的随机数,而不是某一个现实中存在的具体的人。
用户上传的照片,在识别之后会被删除,Face-API服务器上只保存人脸的一些特征信息,并不会长期保存用户的原始上传照片。比如一个照片流式的应用,本身就会要求用户上传照片,那么只需要在应用的服务器收到用户的照片之后,传送一份到Face-API服务器进行人脸检测和识别,应用可以保存用户的通讯录或照片中那个人的具体信息,但是这些东西Face-API的服务器上都不会保存。
在Face-API的接口上,允许应用对照片进一步进行用户标识,也就是说应用可以告诉Face-API服务器,哪些照片是属于一个用户的,而哪些是属于另外一个用户的。在Face-API的服务器端,将实现严格的用户数据隔离,一个用户的照片,只会和这个用户自己的照片进行比较和聚类,在比较和聚类的过程中,不同用户的照片是隔离的,这就在最大程度上保证了用户隐私的保护。
• Face-API 和云计算和移动互联网
人脸识别技术在PC端已经有一些案例了,比如苹果的iMovie和Google的Picasa都带有人脸识别功能。但是,在移动互联网应用方面、在移动设备上,人脸识别运算(特别是最后的人脸聚类运算)所消耗的运算资源和内存资源都是不被允许的。移动设备本身的局限性导致了这个计算无法在本地完成,所以只能交给服务器去完成。
对于人脸识别类的应用来说,识别和比对的运算量是很大的,Face-API完全可以在用户请求比较少的时候,使用很少的服务器计算资源,也就是说使用一个配置较低的服务器来支撑日常的API调度和低请求量的人脸识别和比对计算需求,而在有大量照片需要比对的时候,同时使用很多服务器进行并行运算。
这种工作模式在传统的IDC机房中问题很大,但是有了弹性的云计算环境之后,事情就变得容易多了。
Face-API可以将数据存放在集群的NoSQL数据库中,然后将计算服务器的镜像也存储下来。在需要大规模运算的时候,只要调用云服务API,使用事先准备好的镜像使用1分钟时间部署出所需要的运算服务器,然后通过云计算API启动这些服务器,之后就可以自动调度服务器和NoSQL数据集群中提取所需处理的任务和数据进行高性能的运算。
运算结束之后,或者说是在运算请求量降低,不再需要那么多服务器进行并行运算之后,将并行运算服务器上的数据重新写回NoSQL集群中,然后自动执行关机脚本。调度服务器再通过云计算服务API将这些多余的服务器退掉。
值得一提的是,这次为盛大云计算大赛提供支撑的盛大云服务,是按照小时计费的。
• 人脸识别技术普及后的SNS
长远来看,人脸识别技术并不仅仅是一种简单的计算机智能模式识别技术,更将是一种对人与人之间的关系将带来深远影响的技术变革。
近年来非常火爆的SNS,也就是社会化网络服务,本身就是基于真实的人际关系建立起来的(比如Facebook),由此可见标识个人身份的照片对于SNS是多么重要。如果计算机能够相对准确地对这些照片和身份之间进行一个自动的标识和关联,那么SNS上肯定会出现很多完全不同的、很酷的甚至我们现在还无法想象的应用和服务模式。
人脸识别技术给SNS带来的改变,肯定不会比LBS小。
每一项技术,通常是首先出现在实验室中,然后再尝试将其产品化,在这个过程中新的模式将不断涌现。比如GPS(全球卫星定位系统)最初完全是为了军事目的被发明出来,民用化之后除了进行定位和导航外,很长一段时间并没有新模式出现。突然有一天,人们发现可以提供很多基于位置的服务,一种全新的应用模式就诞生了。
这不是技术创新,而是应用模式创新。人脸识别技术目前也处在这样一个阶段,技术基本成型但缺乏创新的应用模式。这个过程不是单纯靠实验室里面的科学家就可以完成的,而必须集思广益,靠整个社会的智慧来推动。
相信随着Face-API服务的上线,会不断有新的应用涌现,让我们来共同期待吧。
Older Entries Newer Entries