硕鼠的博客站

范路的博客主站,时而会发些东西。

Archive for 6 月, 2012

华蟒沙龙——北京地区的Python活动

盛大创新院北京办公室,继6月16日的《图灵读书会——推荐处理实践》的活动之后,6月17日,又迎来了一场新的活动,《华蟒沙龙——北京地区的Python活动》。

组织这次活动的是金山的@ZoomQuiet 组织的。我个人对Python完全不了解,所以我本来是抱着听天书的准备来参加这次活动。

我个人以前主要是搞Delphi,后来也搞过一段时间的Ruby on Rails,对于动态语言还是有一些了解的。记得以前在Borland的时候,对编程语言是这么分类的:

  • 原生(Native)语言,就像Delphi、C++之类的,直接可以编译得到二进制机器码的语言。
  • 管理(Management)语言,指的是那些编译之后需要在虚拟机上面运行的语言,比如java、C#。
  • 动态(Dynamic)语言则是说的包括Python、ruby、javascript、coffeescript、php这些语言在内的,不需要进行编译,直接通过解释器解释执行的脚本语音。

 

Python在动态语言里面,算是应用范畴比较广泛的一种了,从web开发、移动开发,到服务器脚本、各种网络设备控制都可以使用Python来进行。 

华蟒沙龙这个活动发展到今天,也不都是python的人过来分享,第一个分享者的项目就是使用coffeescript开发的,他做了一个全新世界的描述。

设想了有一个星系,这个星系中有两颗恒星在稳定的运行,在这样的一个星系中如果有一颗和地球很接近的行星,那么这颗行星上的气候、生物应该是一个什么样子呢?这位可敬的科幻迷,模仿了这颗行星的日出日落时间,生成了行星的板块和海洋地形,模仿了大气的流动。他希望在将来能够通过计算机的计算,仿真出这颗行星上面的植物,以及动物生态环境。他的项目是开源的,希望能够有很多对着干项目感兴趣的朋友参与到这个项目中来。

 DSC_0577
DSC_0578

下一位演讲者,为大家分享了又一种web开发框架,python和php都存在大量的框架,就是做web的mvc框架也是非常多的。这一点上,我更喜欢ruby,web框架基本就是rails了。

uliweb应该是一种python的web开发框架,这位分享者上来讲了讲这种框架,以及他使用这种框架的体验和这种框架未来的发展方向。

DSC_0580

在uliweb之后,是一位来自清华的博士,来为大家分享他们做的智能车,以及如何可以非常简单的设计一些硬件产品。

用他的话来说,淘宝可以解决各种各样的问题,可以从淘宝上购买到各种各样的元器件,甚至有些东西还可以要求淘宝卖家帮忙进行改装和调整。他们自己购买了一个底盘,现在已经可以让那辆车在无人驾驶的情况下,横向的移动,以实现贴库的动作。即使是有人的情况,我也没办法操纵我的汽车横向平移。这位博士还以电饭锅为例,介绍了如何改装家里面的电器,如何让程序控制这些等等。

DSC_0597 

当有人问,应该如何从零开始做一件自己的硬件产品时,博士拿出了一个tp-link的便携式无线路由器说:大家可以到淘宝上去买一个这样的路由器,并要求卖家帮忙刷好开源的操作系统,将里面一些用不到的接口用线缆引出来,然后就可以把这个路由器当作一个控制器来用,可以直接通过网络编程,控制那几个接口,实现开关功能,或者接上一个摄像头什么的。

在此之后,豆瓣的工程师分享了一下,他们在trac基础上开发出来的内部开发过程管理工具。这个工具是豆瓣内部使用的,至少目前还没有开放出来的计划。 

大家看到照片上那个红色的、圆形的东西了吗?那是一个番茄计时器,每一个演讲者上台的时候,都会将他们计划的时间设定到计时器上,在计时器响起来的时候,讲演者就还剩最后5分钟的提问和交互时间了。DSC_0586

来自42qu的张教主分享thrift接口语言。现在很多的应用,都需要开放api来为第三方开发者服务,当前比较普遍的方法是使用http、restfull和json,但是这种方法在处理大量二进制数据的时候,效率很差。所以像everntoe这种需要处理二进制内容数据的服务,他们就会选择thrift这种接口语言。thrift这种中间语言,可以被转换成各种常用的编程语言。这样的话,用户不论使用哪种语言来编写他们的第三方应用,都可以转换成thrift的接口语音,然后就能够跨语言、跨框架、跨平台的进行高效的数据调用和交换了。

DSC_0602

最后上来的是来自金山的两个兄弟,包括这场活动的组织者ZoomQuiet,那个T恤上写着人生苦短的就是。他们希望能够通过一对一的教学,现场学习lisp语言。但是这哥儿俩配合得不是很好,基本上就是在规定的时间内,演示了一下编辑器怎么使用,lisp相关的东西,基本没有看到。

DSC_0615

这是华蟒沙龙停摆了一段时间之后,重新启动起来的一场活动,希望这些活动可以更多的办下去,盛大创新院的御膳房会议室欢迎大家。

图灵读书会——推荐系统实践

6月16日,我们的御膳房会议室迎来了一个非常有特色的活动——图灵的读书会。图灵是挂靠在人民邮电出版社下面的一个出版机构,不是很大,每年出的书也不是很多,但是对于一个计算机、软件圈子的人来说,图灵的影响力还是很大的。这主要是是因为图灵所出的图书,品质一直都非常不错。

记得以前有一次和一个出版社的编辑聊天(另外一家以计算机图书闻名的出版社),他说纸质书就是给初学者看的,那些已经达到一定技术层次的人,是不会购买纸质书看的,他们如果有什么需要,通常能够在网络上找到所需内容。所以纸质书就是为初学者设定的。我和图灵的人聊天的时候,他们却告诉我,他们会出一些比较有深度的、比较新、层次比较高的书,哪怕这些书的销量很小,但是对于那些真正需要这些书的人来说,这些书才是真正有价值的。

很难说这两种观点哪个更正确一些,从我个人的角度来说,那些为初学者编写的书籍,可能能够有很好的经济效益。但是那些有层次、有深度,描述最新技术的图书,才是对社会,对整个行业有价值的东西。

图灵的编辑真的很热爱他们所出版的图书,热爱图书本身而不是为图书的销量而忧、而喜。每次见到他们,他们都会满怀激情的向我推荐他们的书,就像计划生育之后的父母们在向周围的人介绍他们唯一的宝贝。

图灵最近在做一些改变,从一个出版机构向社区的方向转型。既然他们已经拥有了一个相对细分的,很有深度的读者和作者、译者人群,那么去维护一个拥有极强购买力和社会影响力的社区,肯定要比做一个单纯的出版机构更加有价值。

DSC_0450

图灵出了不少曲高和寡的图书,比如很多数学方面的书,还有不少算法方面的英文原版书。每次出来做活动,他们总是要带着这些宝贝出来向大家展示。

DSC_0468 DSC_0470

当天推的这本书是一本《推荐系统实践》,这个主题虽然是现在最热门的主题,但是真正能够看懂这本书的人应该并不多。所有人都知道智能推荐是当前互联网和移动互联网中最核心的技术,能够说出其中一些特性的人也不在少数,但是真正了解或者说愿意去了解推荐系统核心算法的人并不是很多。

既然是读书会,那么分享者肯定是和这本书有关的一些人,《推荐系统实践》这本书有两位技术指导,和一位作者。当天的读书会就是有这三位来为大家分享他们各自对于推荐系统的理解和心得。

曾经任职于谷歌,现任腾讯公司情境广告中心总监的王益,是这本书的一位技术指导。腾讯公司情境广告中心总监——王益

王益主要讲了一些广告相关的东西,讲解了广告和推荐的差异。作为一个互联网广告圈子里面的老兵,他讲的东西还是很能够引起不少听众的共鸣的。

来自豆瓣的陈义是本书的另外一位技术指导。

豆瓣的陈义

陈义的语速非常缓慢,听他讲东西是一件非常痛苦的事情,总是觉得非常的困。

下图为本书作者,来自hulu的项亮。 《推荐系统实践》的作者——来自hulu的项亮

和上面两位推荐和互联网广告圈子的老兵比较起来,项亮要稍微稚嫩一些,从中科院毕业时间不久的他,虽然现在就职于hulu,但是讲解的时候,纯数学的东西多了一些,和应用结合得有些生硬。他所能够拿出来列举的案例,大多是hulu的,还有个别amazon的案例,基本都是一带而过了。

所谓推荐系统

推荐系统,其实由来已久,不同的地方仅仅是,现在所说的推荐系统是有计算机系统根据用户的属性和内容的属性进行自动推荐,以前是人工推荐,用比较书面的语言来说叫做编辑推荐,而现在则是计算机自动推荐。自动推荐的好处在于能够在更大的范围内选择内容,向更大的人群做一对一的个性化推荐。这是以前的编辑推荐所无法实现的。

推荐系统需要向用户推荐一些用户所喜欢的东西,但这并不是全部。推荐系统还需要不时的向用户推荐一些新的东西,要保持一定的新奇性。推荐系统中比较典型的电台类应用,其创新性就在于用户可以不断的听到一些新歌,一些从风格判定,推荐系统认为用户应该喜欢的新歌。

在推荐用户喜欢的内容,和用户应该喜欢的新内容之外,推荐系统还需要告知用户,他是怎么工作的,是依据什么做出的推荐。推荐系统需要和用户之间建立起信任,并不断的加深和巩固这种信任。类似于竞价排名和在sns timeline中灌广告都是伤害这种信任的做法。

推荐和广告是两套不同但相近的算法

这两种算法,非常相近,都是希望能够能够将最佳的内容推向用户。但是,也有一些差异。推荐算法只需要考虑用户的满意度即可,也就是说推荐算法所追求的就是不断的提高用户的满意度。但广告算法要复杂一些,广告算法并不仅仅追求用户的满意度,通常用户最满意的广告算法就是没有广告,所以,广告算法所追求的是用户、广告主之间的一种平衡。

推荐的是内容,而广告应该和内容分离开。中国人总是觉得自己比别人更聪明一些。比如百度就将广告直接和内容混合在了一起,做了竞价排名系统。很多人都觉得这是一种不道德的方法,特别是这个行业的老大google号称自己不作恶,他们的搜索结果是完全由算法决定的,不受任何商业因素和人为因素的影响。google是将广告分离出来放在搜索页的旁边,并标注清楚,那是广告。

将内容和广告进行混合,最彻底的应该是SNS系统,但是也有很多SNS系统因为在内容中混入了太多的广告而之逐渐衰亡。国内SNS网站中这种例子很多的。

推荐和广告算法,是当前互联网和移动互联网的关键,核心竞争力

用户进入一个网站的目的是获取内容,所以作为为用户直接推荐内容的推荐系统,是当前各个内容网站的核心功能。

记得以前大家总是在说Web 1.0时代,是网站提供内容,用户自己上网去阅读这些内容。到了web 2.0时代,则是用户自己创造内容,用户自己决定订阅哪些内容,系统自动将用户订阅的内容推送给用户。而到了现在,由于用户创造内容的成本越来越低,用户所创造的内容成几何级数爆炸增长。再有用户自己去筛选自己所需要的内容,并进行订阅已经越来越困难,于是以机器学习为核心的智能推荐系统就成为了互联网和移动互联网服务最核心的功能。

用户的时间越来越紧张,甚至连碎片时间也逐步成为了各个应用和服务所争夺的阵地。如何在有限的时间内尽可能看到更多的用户自己觉得重要和有趣的信息,这就是目前互联网和移动互联网应用和服务所争相研究的领域。Path的成功,就是这种新需求下的新信息组织方式的一次成功,path仅仅是向用户推荐一些他们可能认识的其他用户,path是通过限制好友数量来实现对信息流的约束的。

智能广告推送系统

当直接销售马匹的收入无法让人们满足的时候,人们为马匹分级。当固定的广告位置和报价无法让企业和用户满意的时候,网站上智能广告系统。

最早的互联网广告从传统的平媒广告中继承了很多规则。网站将广告位根据位置和面积进行了详细的划分,然后按照不同的价格销售给不同的广告主。当广告位越来越紧张,用户为了得到更好的体验,希望能够尽量减少广告位置,而广告主虽然需要在有限的广告位上展示他们的广告,但是他们又不愿意为了这些有限的资源支付更多的费用,于是互联网和移动互联网广告又从电视和广播广告行业中学来了新的规则,将同一个广告位,按照不同的时间段分割开来,卖给不同的广告主。

随着广告内容的增长,由网站编辑来处理广告已经越来越困难了。虽然电视台和广播电台都有自动广告播放系统,但是这种系统还是无法适应互联网广告的播放。自动广告播放系统,在同一个时间、同一个频道上播放同一个广告。这对于能够直接计算转换率的互联网广告系统来说显然还不够好。

为了降低单个广告的播出成本,增加单位时间内,单个广告位播放广告的数量,以及这些广告的点击数和转化率。互联网广告服务商在抛弃了按照固定位置销售广告,按照固定时间段和固定位置销售广告位之后,选择了自动推荐广告的方式。也就是根据用户所浏览的内容,自动在广告库中挑选一条用户可能喜欢的广告来播放,在同一个时间段,在同一个广告位置上,不同的用户看到的将是完全不同的广告。

有限的广告播放位置,被从空间和时间上彻底的拓展了。现代的广告推荐系统就是在最大限度上利用广告展示机会,并将转化率提升到最高的一种方法。通过综合的考量,可以确保广告主的广告,特别是那些容易被用户点击的广告,在用户阅读内容的时候,推送到用户面前。然后,根据可靠的记录和统计结果,向广告主收取相应的费用。一个广告被展示了多少次,被点击了多少次,甚至是产生了多少次购买。

互联网和移动互联网广告拥有一个任何传统广告方式都无法匹敌的优势,那就是可以直接转换为购买。任何传统广告,都无法准确的统计到底有多少用户是通过广告走进商店购买商品或服务的。传统广告的效果通常是按照复杂的数学方法评估出来的,而互联网广告却可以直接结算转化率。所以,互联网广告算法就变成了赤裸裸的对转化率的追求。

大部分的互联网广告算法,最早都是来自于google,google应该是目前互联网广告算法的开山鼻祖,也是最前沿的广告技术得以被研发和应用的地方。google在国内的专利,大部分都是和广告相关的。曾经听过一位以前在google工作过的同事说起过google的专利政策,他们觉得那些和搜索相关的核心算法没有必要去申请专利,一旦他们申请了专利,别人就会来抄袭他们的算法。而后台的核心算法,即使被抄袭了,也很难证明。bing就曾经抄袭google的排序算法,google唯一能做的也就是将完全一模一样的搜索结果展示给广大网民,博得一笑。但是google在广告业务方面的专利投入还是非常可观的,他们申请了大量的广告展示、推荐和计数相关的专利。而且将这些广告专利在国内都做了PCT(专利合作条约 PATENT COOPERATION TREATY),也就是说这些专利在国内都是有效的。不过好像没听说过google在专利上起诉过谁,还是那位原来在google工作的同事,他说google的专利政策是避免别人来告google,google很少主动去告别人的。

这个行业里面有google这样一个老大,要比苹果和oracle那种公司成为老大肯定好很多。

高深的数学,让人难以一下听懂

不论是推荐算法还是广告算法,其核心都是高深的数学理论知识。这场活动是我所参加的各种活动中,内容最艰深的一次了。核心的部分,基本听不懂。像我这种层次的人去参加这种活动,也就是能够在案例和叙述的部分,还能听明白一些东西,但是那些数学公式除了让我感觉这个行业异常艰深之外,就不是我这种假行家能够搞明白的了。

推荐系统不论使用什么算法,其关键在于多维数据的整理和分析。所谓的多维,通常至少是数百个维度,据说google已经可以在以亿计的维度中对数据进行分析和比对、排序了。

关于冷启动

对于广告和推荐算法来说,都不得不面对冷启动的问题。推荐算法将冷启动进行了更详细的划分,分为新用户进入系统时的冷启动、新内容进入系统时的冷启动,以及系统中用户和物品都是新的时候的冷启动。

当一个新用户进入系统的时候,系统不了解这个用户,不知道应该向这个用户推荐什么内容或广告。

通常推荐系统的核心算法按照侧重不同,分为以用户为核心的推荐算法和以内容为核心的推荐算法。那些以用户为核心的,就是根据用户的行为特性和用户与用户之间的关系来进行推荐的系统。这种算法有一个通俗的名字叫做协同过滤,通俗的讲,系统分析一个用户的行为习惯,然后找到和他行为习惯相近的用户,将那些和这个用户行为习惯相近的用户们喜欢的东西推荐给这个用户。豆瓣电台应该就是比较典型的协同过滤算法的实例。

这种以用户为核心的推荐算法的问题就是,当新用户进入系统的时候,很难做出准确的推荐。

另外一种以内容为核心的推荐系统,是将内容进行分类,然后以喜欢某一内容的用户,应该也喜欢同一类型的其他内容为基础,向用户进行推荐。亚马逊就是使用的这种方式,当某个用户在亚马逊中点击了某件商铺之后,回到主页就会看到同类型的其他商品的推荐。

这种以内容为核心的推荐算法在新内容进入系统的时候,推荐的效果也会出现偏差。

曾经有一个很神奇的案例,潘多拉电台,在系统上线的时候,用户和内容都是新的。无论采取哪种推荐算法,都难以得到很好的效果。于是潘多拉做了一件事情,邀请了大量的专家,将几十万首歌曲和音乐请这些专家进行评定和打分。将音乐分为四百多个维度进行评定,形成了一个完整的评定模型库。每一个用户进入的时候,首先要填写自己的喜好,系统根据用户的喜好和专家评定的模型库来进行推荐。

一个新的系统,既没有用户也没有内容的时候,总是内容要更容易处理一些。花钱做内容,不论是用什么方法,其投入产出比通常还是可以进行预估的。但是,如果花钱去做用户,其结果通常就像天朝的新闻联播那样,制作和观看的人都知道那是靠不住的。

总结

智能广告系统,对于那些小网站和小应用来说意义不大,这是个大公司才能玩儿得起的东西。现在很多大公司都在做平台,吸引那些小型的应用和服务进驻他们的平台,他们其实就是希望能够依靠广告来赚去利润。

推荐系统将逐步走下神坛,成为所有系统和应用的必备选项。但是推荐系统目前还主要停留在两个极端,大公司可以使用一些数学家来为他们设计模型和算法。而那些创业团队中的程序员们,则完全是根据个人的力量在单打独斗。目前的推荐系统,其数学部分和算法部分,很难被现在学校里面毕业的那些软件学院的本科生甚或是研究生所理解,现在的学校课程的划分越来越细化,那些以应用为目的的学科,其基础课程的重量已经越来越轻了。

记得我95年大学毕业的时候,有人说,数学对于以后的程序员来说所需要用到的绝大部分是加法,减法和乘法偶尔用到,除法基本不用。现在看来,计算机虽然主要用途已经不再是计算,但数学对于这个以智能为核心动力的时代来说显得比以往任何时候都更加重要了。

相信那些位于两个极端中间的一些智能推荐工具将在不久的将来风行起来,那些不需要开发者具备太多专业数学知识,就能够被使用的开源或开放的云端推荐服务和系统,应该会在未来一段时间里面逐渐涌现,并最终形成类似于Apache、Nginx那样的东西。


TUP底层地图服务与LBS应用开发技术分享

会议地址:http://v.to/5Ajc00

 
活动介绍
       LBS是当前最流行的“SoLoMo”中的重要一环,如果要开发一个基于位置的服务或应用,那么这个服务或应用通常需要基于一种底层的地图服务。在本次活动中将向您介绍目前正在为我们提供这种底层服务的企业和产品,他们到底是如何运作的、他们所提供的API到底有什么相同和不同之处。希望通过这次活动,能够让大家了解到这些底层服务,以及如何使用它们。
日程安排
 
19:00-19:30  会议签到
19:30-19:35  主持人开场,介绍嘉宾及会议背景
范路
——盛大创新院高级研究员
19:35-20:05  主题演讲一:空间分析与数据挖掘
王洋
——高德技术开发中心总经理
20:05-20:35 主题演讲二:百度地图API的架构与实践
严俊
——百度地图API前端负责人
20:35-21:30 开放式交流环节
议题介绍
主题演讲一:空间分析与数据挖掘
       本演讲将包括以下内容:1.高德介绍;2.高德的核心技术——空间分析;3.高德地图中的数据挖掘
主题演讲二:百度地图API的架构与实践
       本演讲将包括以下内容:1.百度地图的介绍;2.百度地图API的介绍;3.百度地图API的架构分析;4.百度地图API的实践
演讲嘉宾介绍
 
王洋:
高德技术开发中心总经理
 
严俊:
百度地图API前端负责人
 
会场交通路线:
 
地铁:13号线“五道口”站,向东步行100米,十字路口向北,步行800米即到(路西)
公交:清华东路西口站(355路、628路、333路、355路、438路、466路、运通110路)
双清路南口站(466路)
北京林业大学站(355路、438号、628路、运通110路)
五道口站(307路、331路、375路、562路、630路、656路、690路、731路、848路)

 

参加第16期五道口沙龙——社交视频分享

关于五道口沙龙

这是我第一次参加这个网易和一大堆赞助商合办的活动,虽然叫做五道口沙龙,但是位置距离五道口还是有一定的距离的。周日(2012年6月10日)的这一期在北大博雅国际酒店举办。酒店相当不错,wifi速度很快。唯一的缺憾就是,来参会的人实在是少了些。总共也就是三四十人的样子。因为当天有一个盛大创新院的主题,盛大创新院就来了7个人,其他几个有主题的单位再加上赞助单位和网易自己过啦的人,不知道会场里面是不是还有其他人。

按道理来说,网易应该也算是一块金字招牌,五道口更是号称宇宙的中心,就算网易办的五道口沙龙,距离五道口稍微远了一些,也不应该只有这么几个人参与啊?而且,社交视频分享这个话题也算是一个比较热门的话题了。

我心中的疑惑在会议开始之后,被主持人解答了。主持人要求大家使用网易微博进行讨论,看来他们也是在网易微博上做的宣传。做这种会议,缺乏开放的心态,是很有问题的。

五道口沙龙里面当然也不是一无是处,一个比较有趣的东西就是那个横向数据比较表。在会场的前面有一块大号的白板,上面是每一个应用的名字,在每一位嘉宾开始之前,必须要介绍应用的基本情况。包括上线时间,用户数,日上载视频数字,团队人数和融资情况。

当天的四个产品,用户数字都很少,大部分人都不好意思说。即使是有几个不怕丢人的,也就是十几二十万用户的样子。上线时间有先有后,但前后也差不出几个月,基本都是看到viddy拿到风险投资之后,开始做的。日上载数字,优酷拍客有接近1000个,微酷和微拍都是100个左右。团队规模基本上都在10人上下。资金状态,微酷和优酷拍客是用的企业内部资金,微拍拿的是创新工场的投资,眩拍使用的则是天使投资。

 

很遗憾没有拍什么照片,大家到网易微博上去找照片吧。就算拍也拍不到几个人。

 

社交视频分享

这期的主题是社交视频分享,在Instagram被10亿美金收购,在Viddy和SocialCam蓬勃发展的今天,通过社交平台进行多媒体信息的分享,肯定是一个非常热门的话题。

国外的Social Network Services在开创的时候,在多媒体信息这一块做得都不是很好。Twitter根本就不支持图片,Facebook虽然支持图片和视频,但是在pc端和移动端支持得都不是很好。这就给国外的图片微博、视频微博等多媒体内容分享的平台留下了充分的生存空间。

更加有别于国内市场的地方在于,即使那些SNS巨头们发现了这个新的盈利点,他们也没有冲过来将其吃掉,而是选择了耐心的等待,在这块领域的产品相对成熟之后,将其收购下来。在活动后面的投资经理点评环节,嘉宾也说了,在国外这种企业有着第三种退出方式,而国内通常只有两种。也就是说,在自己盈利和IPO上市之外,国外的此类应用还可以被大公司并购。

国内的社交视频分享市场,在看到了国外大量同类应用蓬勃发展的时候,也逐渐升温,就像任何一个在国外发展得很好的领域那样,迅速的杀出很多大小鲨鱼、鳄鱼和食人鱼,抢夺着不多的几个高端白领用户。

微酷——高科技堆砌出来的产品

微酷的介绍,听起来他们的特色主要是在于技术门槛。微酷不像其他几家那样使用通用的滤镜渲染引擎,而是完全自主开发了一套实时拍摄渲染滤镜引擎。他们现在在产品中展现出来的仅仅是这个庞大、强大、神奇、划时代引擎的冰山一角。

而且,在微酷超强研发团队的努力下,他们将这套引擎中的绝大部分功能,优化之后,从服务器端迁移到了移动端。用户完全可以在本地就享用那把杀鸡用的牛刀。

微酷将产品的各个细节介绍得非常详细,感觉就像是在向导师做课程设计的大作业报告。但是好像漏掉了用户的部分,没有用户故事,没有说明微酷在满足哪些用户的哪些具体需求,以及微酷自己到底为用户解决了一些什么问题。应该仅仅是漏掉了吧,这样一款产品怎么可能缺乏这么关键东西呢?

拍客——依托大平台的UGC延伸

继微酷之后,第二个上来做分享的是拍客,拍客是优酷的一个拍摄工具。

其实拍客并不算是一个完整的社交视频分享工具。一个完整的SNS内容分享工具,应该包括数据的录入(拍摄或本地上传),数据的处理(智能分类和推荐、分发),数据的输出(用户订阅和消费内容)三个部分。拍客仅仅完成了数据的录入和部分的数据处理。其他的部分都是在优酷上面实现的。所以拍客只能算是优酷的一个UGC延伸工具。

优酷最早也是希望能够复制Youtube做UGC(用户生成内容)模式,后来转向了Hulu模式。也就是购买版权,在用户消费有版权内容的时候,依靠广告收益达到盈利目标。

各大互联网视频网站拿着美国股民的钱血拼中国电视剧版权的结果,就是电视剧的版权价格快速的起飞。普通剧集每集的成本也要达到几十万人民币,那些热播剧更是高得可怕。

优酷在并购了土豆之后,还在和腾讯、新浪、搜狐、百度等大号互联网公司继续争夺版权内容。同时,他们也转过头来,希望能够有更多的UGC内容充实他们的内容库。UGC内容成本基本可以忽略不计,但同样可以带来一定的收益。

拍客的口号是:这一秒在你拍,下一秒世界在看。优酷充分的利用了现在互联网第一视频网站的身份,向使用拍客的用户承诺最大的观看用户数。他们将审核上线时间缩短,让拍客所拍摄的内容具备更强的时效性和媒体性。并在优酷中使用最好的推荐位置,推荐那些热门的拍客视频。

优酷还利用优酷已经被所有SNS网站都接受了的播放器来将拍客拍摄的视频直接推送到所有的SNS网站上去。其他一些应用本来也可以利用这种便利的,但是仅仅是因为一些技术人员的洁癖,他们放弃了。

拍客解决了用户内容快速传播的需求——快速的审核,最好的位置向最大的视频网站的用户直接推荐,直接无障碍的在各种SNS平台上流传。以后他们还准备再将各个sns平台上面的评论归并回优酷平台,可以让用户在统一的平台上看到所有sns平台上面对他发布内容的回馈。

眩拍——华丽转型直播客,仍然前途未卜

眩拍是个很奇怪的产品,作为嘉宾跑来分享社交视频分享应用,但是站在台上却说他们发现这个领域完全没有生存空间,所以已经完全转向了。眩拍产品的最后一个版本是去年11月的,在那之后已经停止更新了。现在在做直播客,做线上视频直播。

今天早晨在网上搜了艘,大家在讨论主要是直播客的网站为什么打不开了?这也许并不是周日演讲的那个直播客,但是可以想见,在天朝统治下,这种直播类的应用运营风险是十分巨大的。运营成本也是非常恐怖的,这种应用都是需要用真人来对内容进行审核,万一不慎直播了个散步或者交通事故什么的,可能马上就会面临灭顶之灾。

微拍——夹缝中求生存,做大公司不愿意做的事情

微拍的那位分享嘉宾就是中国特色的职业创业家。这种人以创业为职业,一次一次的创业,将创业过程中的各种环节都摸得非常透彻。就像我们通过高中三年的培训,能够将一个个的学生培养成考试专家那样,这些人对于创业中每一个环节的数据把握得相当精确。

微拍在开始做之前,就做过详细的市场和用户分析,他们发现优酷之类的大型网站主要盯着的是媒体性较强的内容,于是他们就决定不做那些媒体性强的内容,而是做那些没有什么明确意义的内容,以无聊人群和无聊内容为主要目标。大公司瞄准的是后置摄像头,微拍就瞄准前置摄像头做自拍。总之,微拍是做一些大公司不愿意做得范畴。

微拍的特色就是美女视频,一些90后自拍一些很无聊的自拍美女视频,这些视频完全没有任何实际的意义,但是却吸引力大量无聊的人事上去点击观看。做互联网和移动互联网应用的一个原则就是“永远不要低估无聊的力量”,当你觉得一个应用很无聊的时候,总会有一些更加无聊的人来使用这个应用。

这其中深层次的原因,据嘉宾说,他们自己也不是很清楚。但是有不少人在上面询问微信号码,看来还是满足了一些温饱之外的根本需求。

微拍满足了用户空虚无聊时的某些特定需求,那些新人类总有些老头儿、老太太们很难理解的需求,微拍很好的满足了这些需求,所以在吸引了很多新新人类的同时,也吸引了不少邪恶的大叔。

微拍的定位非常精确,对于用户心理的把握也十分准确。他们所有的界面,包括图标和操控的设定都是为了能够吸引他们的目标用户(90后小女生)。微拍也没有妄图依靠视频分享来建立自己的SNS社区,而是完全采用的新浪微博账号。那个从无到有建立SNS社区的大时代已经过去了,现在还想做这件事情,所需付出的成本将变得非常高昂,而且成功的机会不大。

对于微拍这个产品,他的用户群体和腾讯的QQ、空间、圈子、朋友、微信群体的重合度非常高,如果被腾讯模仿推出类似产品,或在某些相关产品中推出了类似功能,微拍能够成功抵御的机会微乎其微。这可能也是微拍使用新浪微博账号而不使用腾讯账号的一个根本原因吧。

总结

今天困扰着视频行业的有些问题,在未来将不再是问题。带宽、容量、流量的费用,这些目前困扰着国内视频行业的问题,应该都会随着时间的推移而逐渐被解决。可以预见,在不久的将来,存储介质的价格会不断的下降,服务器带宽资源和成本也会随着越来越多的数据中心如雨后春笋般在神州大地上逐步的建立起来而快速的下降。城市里面的带宽正在不断的变大,wifi的覆盖面积正在逐步的扩大,终端流量最终肯定会走向免费的。

当然也有一些问题解决起来会慢一些。虽然随着移动终端芯片的能力越来越强,多媒体内容可以采用一些更好的压缩方式。但是移动终端电池的容量在短期内还是很难提升的,而多媒体应用在耗电方面估计应该也是很难降低的。另外就是内容审核这个巨大的人工成本应该在短期内也是很难消除的。多媒体内容的计算机检索和基于内容的智能推荐在短期内也是很难有可以产品化的技术问世。现在通过文字和用户行为分析来进行内容推荐的方式,将成为拖累视频内容分享继续发展下去的一个重要因素。

任何应用的发展关键还是在于“如何抓住客户”,采用了多么神奇的技术,如果那不是用户所需要的,还不如不要。任何应用都需要为用户解决具体的实际问题。如果无法解决实际的、具体的问题,那么这个应用只能停留在实验室里面,为这种应用去做推广完全就是浪费。

除了微酷提到了因为用户使用了手机,所以他们的应用就是强社交应用之外,其他几家都不敢妄谈社交,只是在说应该如何增强用户和内容之间的互动,如何利用好现有的社交平台,特别是优酷拍客,他们投入了大量的人工编辑,对有限的内容进行人肉处理和推荐,让有限的内容尽可能发挥出更大的作用。利用现有的用户和sns上面的用户,尽可能的围绕有限的优质内容进行互动。微拍更是省去了自己的用户体系,直接使用新浪微博的账号体系。现在这个时代,还妄想要从无到有重新建立起一个全新的SNS关系,并不能说是完全的痴人说梦,如果不是在非常封闭的细分市场中积累个三五年,基本是不现实的。

在有大量的职业创业者和大型鲨鱼、鳄鱼、食人鱼参与的社交视频分享这个圈子里面,就像其他类似的圈子一样,应该还是有可能出现一些成功团队的。

以前总是以为,在国内,人力成本很低,用户基数非常庞大,各种规章制度不是很健全,通过一些手段可以将国外应用积累了几年才能达到的数字快速的达到。现在看来,考验一个项目的生命周期其实并没有缩短,还是需要三到五年的时间,只是和国外的差别是,别人在着三到五年中,逐步改进产品,积累用户;而我们则是先快速冲击数据,然后再逐步改进产品,积累真实用户。

周日去五道口沙龙分享的四位嘉宾最终是否能够有人在这里面脱颖而出,我们这里做预言实在是太早也太不负责任了,最终还是要看谁能够持续的改进产品,积累用户。当然,这个里面政策和运气的因素也是非常重要的。

五道口沙龙以后应该不会再去参加了,实在是比较无聊。

第162期IT龙门阵——移动云存储

 

2012年的5月29日,是第162期IT龙门阵。这一期的龙门阵是技术专场,按照惯例在盛大创新院北京办公室的御膳房会议室里面举行。

这一期的主题是一个非常热门的主题,至少要比前面两期的《模式识别》和《虚拟现实、增强现实》要热门得多。这期活动请到的嘉宾,有百度的移动云计算事业部架构师郭杏荣、金山的快盘业务负责人、金山云CTO杨刚和网易的有道云笔记团队负责人蒋炜航。他们分别向大家介绍了《百度网盘:百度云存储的技术演进》、《金山快盘,如何从零做大云存储》和《有道云笔记技术架构及OpenAPI设计》。

会议开始的时候,由本人作为主持人至开场词。

IMG 1460

 

由于话题很热,嘉宾的分量也比较足,所以这一期到会的人非常多。

IMG 1465

在几位嘉宾分享之后,是一个互动环节。三位嘉宾再加上来自百度的百度移动云事业部 高级产品经理张辉一起接受参会者的提问,当然,作为主持人,我利用先发优势,抢占了最开始的两个问题。

IMG 1564

 

会议结束之后,四位嘉宾的合影,从左到右分别是:张辉、郭杏荣、杨刚、蒋炜航。

IMG 1616

趁此机会,会议的工作人员也得以和嘉宾们合影留念。
IMG 1615

 

会议的进程基本就是这样了,下面是我从会议中听到的一些有趣的东西。

这期活动中有一点是非常有趣,那就是到场的两位嘉宾的观点是存在巨大分歧的,他们在现场虽然不好意思直接指着对方的鼻子进行争论,但是言语中所夹带的枪棒却是绝对不留情面的。这导致了现场的火药味一直是比较浓烈的。

百度的基础架构来自于多年的积累和演进

作为国内最大的互联网公司,百度的基础架构完全是在自己从头构建的。百度的存储系统架构,经过了多年的积累从1.0到2.0再到现在。一代一代的迭代过来,是最适合百度内部需求的一套体系。

百度现在就是在这套体系上,将部分功能包装开放出来,供开发者和用户来使用。

百度现在正在山西建设他们的新数据中心。百度将数据中心放在山西的理由非常有趣——山西是中国的产煤大省,山西就近利用这些煤炭资源进行火力发电,所以山西的电价比其他省份便宜。我记得以前也曾经听说过类似的故事,那就是黑龙江大力兴建云计算的数据中心,因为那里天气寒冷,在冬天可以节省空调电费。

现在看来,如果想要在中国做云存储、云计算,掌握自己的IDC资源还是非常重要的一件事情的。国外的云存储大多是建立在别人的基础架构上面的,但是国内的云存储服务,一上来就跳过了一开始的产品差异化竞争阶段,直接到达了中国人最擅长的价格战阶段。在这个阶段,将服务架设在别人的IDC上,对于成本的控制,肯定是非常难以接受的。

百度的云服务

百度的开放平台服务分为两种层次,一个层次是面向开发者的,使用这个层次的服务,需要向百度付费。开发者使用这个层次的服务,数据存放在开发者自己申请的账号上面。另外一个层次,是面向最终用户的。也就是说开发者开发了应用,这些应用必须要得到最终用户的授权才能使用,而数据存放在最终用户的账号上面,开发者的应用必须通过用户的授权才能够访问这些数据,实现自己的功能。

现在,ES文件管理器、美图秀秀等这些应用都使用百度面向最终用户的那一层接口,为他们原来的应用添加了云存储的功能。

金山的云存储之路

金山快盘是从金山WPS团队中分离出来的。金山云是在以金山快盘为基础新组建的一家公司,金山云主要是以金山快盘和金山WPS office为基础,为企事业单位提供云服务的。

金山不像是百度那样可以通过漫长的积累,逐步形成自己的存储架构。毕竟金山以前并不是一家互联网企业,所以他们想要做云存储,就必须要从头开始搭建自己的云计算平台架构。

金山研究了当前比较流行的各种分布式存储系统和分布式文件系统,认真分析之后,没有采用其中任何一种。而是扬长避短,根据自己的需求,开发出了完全属于自己的分布式存储系统和文件系统。

金山快盘应该算是这个圈子里面的先行者吧,所以他们拥有比较多的合作伙伴。腾讯的web qq里面允许用户在金山快盘和腾讯自己的网盘之间进行选择。

金山在不久的将来准备推出面向企业的版本,并为个人用户提供更高级的付费服务。

网易有道笔记的敏捷开发故事

有道笔记,是网易内部的一个孵化项目。应该和盛大创新院孵化的麦库笔记在各个方面都是非常相类似的吧。

从存储架构上来说,有道笔记要比金山和百度简单很多。在会议结束的时候,有道笔记的蒋炜航基本已经和百度的郭杏荣达成了一致,准备将有道笔记搬迁到百度的基础架构上去。

有道笔记是典型的小团队作战的产物。

有道笔记利用现在十分流行的敏捷开发方式,在管理着他们的团队。他们的一个周期是一个月,每个周期都会确保完成一定的功能指标。

关于敏捷,这里就不多讲了,那是一个现在十分热门的话题。为什么要敏捷,如何敏捷,敏捷带来了什么结果等等,研究的人太多了,感想和成果也太多了。感觉有些像皇帝的新衣,没有任何人说这个东西不好。而在正常的情况下,一种方法总是应该有两面性,总会有其适用和不适用的环境。如果所有人都说一种方法很好,那么这里面就肯定有问题。

有道笔记的核心功能以及外围功能的选择

蒋炜航讲到,他们做笔记类应用的时候,首先关注的是核心功能。作为笔记类软件的最核心的功能,肯定是编辑器。一种好用的,所见即所得,在所有平台上表现一致,支持图片等媒体的富文本编辑器。

在客户端软件时代,这是一件非常麻烦的事情,因为那个时代的编辑器都需要考虑图片等媒体内容的存储问题。而且,那个时代比较流行的是RTF格式,以及各种RTF的变种。

在web时代,这个问题一下就解决了,html本身就是一种富文本格式,对于常见的格式需求基本上都可以满足。而且,html里面的图片和其他媒体内容并不是存放在html文件里面,而是通过特定的标记引入。现在开源的html编辑器非常多,而且效果都相当不错。

在尝试了很多方式之后,他们决定在客户端和服务器端统一使用web编辑器,于是新问题就产生了,他们没法确保客户端运行的环境中浏览器的类型和版本是一致的,也就无法保证同一个编辑器在不同的浏览器以及浏览器版本中所表现出来的体验是一致的。最终有道笔记决定直接在客户端里面打包浏览器,现在的有道笔记中嵌入的是chrome的内核。

有道围绕着个人笔记这个核心功能,又逐步开发了白板拍摄功能和手写功能等辅助功能。现在很多产品在进行辅助功能选择的时候,喜欢将各种乱七八糟的东西都加进去。有道做这种选择的时候,是围绕笔记用户的核心需求,谨慎挑选。那些距离核心需求比较远的东西,他们不会在自己的应用里面实现,而是留出了开放的API接口,让其他人去实现。他们自己只去做那些核心的功能。

有道笔记即将推出他们自己的开放平台。在过来参加活动的当天,有道笔记的用户数刚好达到300万,他们准备在不久的将来,正式开放他们的API。只有拥有了用户,API才能为开发者带来利益。

二进制文件的增量更新

百度和有道笔记都提到了,在他们的系统中,内容是进行增量同步的。当文件的一部分发生变化的时候,他们能够找到发生变化的部分,然后只将变化的部分传输到服务器或客户端。这样可以极大的节省带宽,适应移动应用的需求。

现场一位参会者希望了解这到底是如何实现的,有道的蒋炜航直接回答,这是他们的技术机密。百度的郭杏荣说,大家可以去查看一些公开的论文,应该会有所收获的。

云存储的成本之争

按照百度的计算,他们自己建立数据中心之后,云存储的价格,计算上带宽应该在5元/G/年的样子。他们希望摩尔定律能够在存储这个领域里面同样发生效应。那么在未来的两三年中,云存储的价格应该能够下降到每年每GB,一元到两元的样子。

金山的杨刚号称,他们采用了一些独到的技术,可以将存储成本降低到别人根本无法想想的地步。言下之意应该就是他们的存储成本远远低于百度刚刚提出的数值,遗憾的是他既没有介绍那独有的技术,也没有具体说他们的成本具体降低到了什么样的程度。他相信在不远的将来,金山能够将云存储的成本降低到和物理硬盘的存储成本差不多。

对于云存储的成本可能会降低到物理硬盘成本这一点,百度的嘉宾认为这是永远也不可能实现的。

云存储的商业模式之争

金山希望能够复制dropbox的道路,最终依靠4%左右的付费率,使得整个云存储业务实现盈利。金山希望能够通过让更多的人,负担更少的钱,来实现盈利。dropbox的收费对于大部分中国来说,还是贵了一些。所以金山希望能够降低成本,降低每一个用户需要支付的费用,同时设法提高支付的比例。

百度则认为,在中国不可能成功复制dropbox模式,现在的同质化竞争已经太激烈了。一旦收费,就意味着流失用户。所以,百度准备发挥他们的长处,依靠流量和数据来赚钱。永远为用户提供免费的服务,依靠广告再慢慢将前期投入和后期成本背回来。

在现场,百度的张辉讲了一个有趣数据,那就是evernote的第一年用户,付费比例只有不到0.4%,而累计使用四年以上的用户,付费比例能够达到惊人的25%。张辉和我都是三四年的evernote用户,也都是付费用户。这最终说明,做此类应用,大家比拼的是生存能力。必须要要熬到四年、五年不死,才有盈利的可能。

百度的盈利模式

百度的郭杏荣和张辉反复提到了百度的流量变现能力。百度拥有很强的流量和广告变现能力。他们每年都会在百度联盟内部分发大量的现金,以感谢那些为百度带来流量的合作者。这笔返还现金去年达到了20亿人民币,累计已经达到了40亿人民币。

郭杏荣向有道的蒋炜航承诺的也是,当有道搬迁到百度上面之后,完全可以通过百度的流量变现方式,得到收入,并最终可能实现盈利。

商业的竞争和合作

虽然现场金山和百度剑拔弩张,但是他们两家也都提到,优酷和土豆这一对儿老冤家都能够通过并购实现整合,所以未来的事情谁也说不好。说不定未来的某一天他们之间也会发生一些在现在看来完全无法想像的事情。

如何面对国外的竞品进入

现场有一位参会者在互动环节问了一个问题,现在这些产品,都有国外的成功原型,当这些我们所模仿的竞品进入中国市场的时候,现在这些产品应该怎么办呢?特别是印象笔记作为有道笔记模仿的原型,已经拿到了中国的宽带基金的投资,高调的进入了中国市场。

有道的蒋炜航说,这其实没有什么可怕的。Evernote虽然在国际上很成功,但是在国内的用户其实很少,只有不到100万。国外产品的进入,可以很好的教育市场,培训用户,让人们真正了解到,什么才是笔记类应用,以及应该如何使用笔记类的应用等等。国外精品一旦进入中国,就会和国内的产品站在同一个起跑线上,同样运行在墙内,同样受到有关部门的监管。

百度的郭杏荣在这个时候抢过了话筒,他说,国际上的精品进入国内,这没什么可怕的。他们(百度)的竞争对手也是很强大的,他们(谷歌)来过了,然后又走了。百度已经战胜了他们的竞争对手。全场的嘉宾和参会者听了之后,先是一愣,然后大多满脸复杂的神情,会场上响起了不是很热烈的掌声。大多数人心里的感觉应该都是怪怪的。百度的这种说法从某种意义上来说,不能说是错了,但是总感觉有些胜之不武。

 

移动云存储这一期活动,现场异常火爆,现场嘉宾之间有合作也有竞争。我很期待在将来能够看到当天的嘉宾们之间能够上演一部激情澎湃的爱恨情仇。

下一期IT龙门阵的技术场,应该是地图专场,6月19日下午7点半到9点半,老地方见。详细情况还要等IT龙门阵官网的通知。

 

Close Bitnami banner
Bitnami