硕鼠的博客站

范路的博客主站,时而会发些东西。

Category : 梦想园

图片存储和分享开源系统的设想

好像好久没有更新博客了,以前在上海的时候,还能够坚持每周更新一次。现在会到了北京,周末的时间能够和家人在一起,反而没有时间更新博客了。后面还是尽量保持更新吧。虽然我的博客看的人不多,就算是给自己留下的一些回忆吧。

这篇博客,是很早之前写的,前面几篇博客也提到过,但是由于一些比较麻烦的问题,一直没有贴,最近好像麻烦的问题都处理干净了,那么就贴出来吧,这个周末如果有时间的话,没准儿还能再写一点儿。

为什么需要这种开源系统

在写这篇博客的时候,我并不知道是否已经存在了这样的一套系统,或类似的系统。可能有,也可能没有。我想,有的可能性应该更大一些吧。

这种开源系统,是为了解决不同的人,不同的机构之间进行图片应用开发过程中进行分工的。如果每一个想要提供图片底层服务的企业、团队或者个人,都去编制一套自己的标准,并设立一套自己的API和接口。那么,那些想要开发上层图片应用的个人或机构,就必须做出选择,到底是使用哪一家的。一旦他们做出了选择,则很难再进行改变。一次只能使用1家的服务,很难为统、同一个上层服务,选择多家供应商提供的底层服务。

如果有一套开源的系统,一套相对简单,但功能基本完整的图片底层服务接口。有很多厂商以此为基础,提供服务。那么是不是可以部分解决这种问题呢?有这种可能,但也不能肯定。毕竟很多大的厂商,喜欢搞封闭的一套。

所以这里只能说是一种设想和可能。并不是对此类系统进行可行性的分析。

基本的架构

这种系统,通常是分为底层架构、功能实现和扩展接口三个部分的。这里并不是做软件架构,所以就不那么详细的来分拆了。只是把一些软件需要具备的基本功能,和留给扩展的接口简单的介绍一下。

我并不想自己去开发一套类似的东西,至少目前还不想。所以说是功能介绍,好像并不太准确。作为一篇准备放在梦想园板块中的博客,大家就当我是在介绍一个梦想中已经实现了的软件吧。

结合OpenID的认证系统

照片系统中,有一个功能是必须具备的。那就是用户认证系统。如果是像传统网站那样自己搞一套用户注册体系,那么肯定是会有问题的。因为这套系统的设想是分布在不同的网站或服务器上,然后让用户自由选择,将照片放到不同的服务器上。一个用户可能同时会使用多个照片服务器。那么就要求照片服务器所使用的用户登录和认证体系必须是统一的。按照现在的流行趋势来看,使用OpenID认证系统看来是一个不错的选择。

现在,提供OpenID认证体系的公司越来越多了,甚至国内还有一些小型的网站,利用开源系统,提供OpenID认证。国内比较常用的一些认证体系,也逐步开始支持OpenID了。

图片系统如果能够使用OpenID,那么就有可能实现跨服务器的认证和权限分配。可以在不同的服务器上,使用同一个OpenID进行登录和认证,只有这样才有可能实现跨服务器的图片存储。

统一的图片调阅权限审核

图片除了写入时的认证之外,还有一个非常重要的问题,就是图片的调阅认证,什么样的人,可以调阅什么样的图片,这是避免陈冠希悲剧再度重演的必要保障。由于图片是存放在不同服务器上的,那么最好能够直接将调阅权限和每一张图片绑定,每一张图片单独的判断,来人是否有权调阅。

应该使用统一的短链接服务,来进行所有图片的解析。这样所有图片的连接地址,就统一了。每一个需要调阅图片的访问,都使用统一的短链接进行调阅。在短链接转换之后,到特定的图床服务器上去验证调阅的权限。调阅者最好和图片拥有者使用统一的OpenID系统来进行认证,这样的话,关系的处理,就可以放到图床体系的外面去了。

基本的图片加工系统

图片进入图床服务器之后,根据不同的需要,可以进行一些简单的图像加工和变换。这个系统,应该是建立在图床服务器里面的,图床服务器应该提供一些基本的功能,并留出开放的接口,可以接入其他标准的图片加工工具。

通常会用到的图片加工类型有:格式转换、精度和分辨率转换、剪裁、水印、简单的色彩调整,以及图片的拼接等。这些功能基本上使用现有的imagemagick应该都是可以实现的。至于一些特殊的图像转换,比如2D转3D,添加版权水印等,都可以留出接口,让需要的人自己去添加。

图片是属于图片所有者的,那么图片的各种变形,理论上来说也应该是属于图片所有者的。如果图片所有者能够提供这些图片的常用变形版本,那么大部分图片调阅者都会选择直接调阅的。所以图床系统缓存原始图片的各种常用变形对于图片的传播和保存,都是有好处的。系统可以在图片的某些特殊格式或变形被调阅的时候,自动生成符合要求的图片,然后进行缓存,如果同样的格式再次被调用,那么就直接使用缓存的结果。

可以在图片的短链接后面,添加上对于格式的要求,来形成新的图片链接。比如:http://***.**/aCq3D/w800BW 就可以代表前面那幅图片宽度为800的黑白二值版本。

这样,每一个图片有一个唯一的url链接,同一张图片的不同变形,也有唯一的url链接,而且这个链接和原图的链接是有明确关联的,任何人或系统,可以在得到原图url或某一种特定变形的url之后,计算出这个图片其他各种变形的url来。图床服务器可以不用为每一个特定的变形进行运算,得到某种特定的变形url访问之后,首先要判断的还是权限的问题,要判断访问者是否有权限使用这种特定的变形。比如说,通常不是每个人都有权限调阅原始图片的。 一些相近的图片变形,是可以互相替换的。比如,有人刚调用了一次宽度为800的图片,图床服务器进行了运算,并缓存了这个分辨率的图片,紧接着又有人来调用宽度为790的图片,那么就不用运算了,直接将800的给出去就好了。

统一的图片短链接服务

提供图片短链接,应该是和普通短链接不同的。普通的短链接是使用完整的连接,进行hash之后,得到的一个几十甚至是上百进制的数值。所生成的数值,只与原来的URL有关。

图片的短链接,应该是与图片本身相关的,也就是说,可以直接对图片进行指纹提取,然后再对图片解压缩后的原始二进制数据,进行hash,然后使用这个hash值对图片网址进行存储。这样的话,就可以实现相同的图片,使用相同的短链接,多个存放了相同图片的URL,其相对应的短链接是一致的。然后使用负载均衡来自动派发请求。即使图片的存储的格式有些许差异,其对应的短链接,也是一样的。

由于上文中说到的各种图片变形格式的唯一短链接,所以这个系统还有一点有别于其他短链接系统,这个短链接系统需要在那一窜几十上百进制的字符串之后,留出一段明文的,可以进行解析的图片格式说明语言。每一个图床服务器上的URL,过来注册和转换短链接的时候,应该标明自己支持哪些格式标识,这样短链接服务器在转换短链接的时候,就可以根据用户请求的特定格式,来分配服务器。

这个短链接系统,应该是和图床系统相分割独立的,但又是相辅相成的,这里就把它作为一个图床的辅助系统,写在这里吧。

图片的组织和存储系统

图片本身,是有一定的关系的。由于现在基于图片的搜索还比较困难,目前只有google的picasa里面使用到了头像识别来进行图片的标示和定位。所以通常是使用一些文字来对图片进行标注、分类和描述,也有些系统可以使用时间和地理位置来定位图片。

对图片进行标示和分类、文字描述,其目的就在于希望能够更方便、更准确的搜索和定位图片。如果要做一套开源的,可以多服务器联合工作的图床系统的话,那么就要求图形的组织、标示、标注和分类、文字描述等系统,是独立于所有图床服务器之外的,是可以跨服务器工作的。那么,这里的设想就是,图床服务器是独立工作的,只负责处理图像的存储和调阅以及相关过程中的权限设定和审查、验证,图床服务器不互相引用其他同类服务器。所有图片的组织和分类信息,由其他系统来完成这里不讨论。

图片使用的审计和统计系统

图片的上传、修改和调阅,是需要一个日志系统的。那么这个日志系统,可以附带各种审计和统计的功能。甚至可以一次为接口,开发一些计费功能。开源软件上就不需要计费系统了,但是可以把接口保留下来,以备日后使用。

功能的设想和拓展

一个系统的生命力,部分取决于其可扩展性。为了保持一定的扩展性,开源图床应该具备一些必要的接口,来进行某些扩展。

前面提到的图片转换接口,可以在基本图片加工和转换功能之外,添加特定的图片转换功能。

图片存储和使用的统计,并最终留出计费接口。

开源的图床系统,只需要考虑单机工作就好了,但是如果有的公司系统以此为基础,建立大型系统,那么也应该留出自组网和多服务器协同工作的接口。

至于分享到微博等social网站、接受反馈并记录,进行分类和标注标识等等,应该是在其他系统里面完成的,和本系统无关。那些系统可以依靠开放的API接口来使用本系统中的图片资源,可以使用同样的认证体系。

调整、部署以及推广

本文纯属YY,那么就让我继续Y完吧。如果真的有了这么一套系统,那么应该如何推广呢?首先要去吸引那些个人站长,他们可以在自己租用的空间上部署,并存放一些自己的照片,也可以存放一些朋友的照片。然后,可以让一些个人或小团队,在此基础上,建立一些小的,基于图片的新的应用。如果这些能够成功的话,最后可能会有企业对其进行修改,添加上计费的模块,并部署更大型的,但与之相兼容的系统。

隔了好久都没有更新博客了,事情有些多。我想这不应该成为理由。回到了北京,周六日需要陪伴家人,没时间写博客了,这是其中的一个原因,这篇东西,写了好几周,我自己也不是很满意,但最终还是觉得应该丢出来,算是对自己思想的一种记录吧。以后尽量保持每周写博客,但是也很难保证,只能说尽量吧。

1307518843_testimonials 说人口红利的时代正在逐步的过去。依靠高度集中的制造业,实现经济增长的时代已经过去了。
不过,现在还是有很多地方,地价和劳动力收入要低于大中型城市的平均水平。感谢国家的义务教育政策,即使是低收入地区,那里的人口素质也还是相当不错的,至少能读能写,经过培训之后,应该也可以完成简单的计算机操作。
那么是否有可能,在这些地方,组织人员生产内容,供高收入地区进行消费呢?
让他们自己去生产内容,是比较困难的,或者至少是成功律不高的,可能很多人生产的内容,无法找到订阅者,最终即使是在比较低的生活水平下,他们也无法通过生产内容来养活自己。那么,比较可行的办法就是作现有信息的挖掘、过滤、排序和聚合。
现在,很多人都在关注一个问题,那就是信息过载,我们可以自由的得到很多信息,多到我们自己都看不过来。如果是靠机器筛选,现在好像还没有那么好的算法。那么,是否可以依靠人工来筛选呢?答案是肯定的,只要这个筛选的人,他所需的成本,是在我们消费这些信息的人,所能够承受得起的。
要想实现,在低收入、低房价地区组织人力,为人们提供信息检索和聚合服务,有些问题还是需要克服的。 1307519038_junk_email_filter

  • 要有一套统一的、精确的,可以验证的信息分类、过滤和排序标准,哪怕不能进行机器验证,至少也要能够进行人工验证。
  • 良好的监控平台,可以监控所有进行信息筛选的人,给出有质量的结果,不重复,不遗漏,条例清晰,排序合理,并符合客户的要求,不得夹杂任何其他因素(比如:竞价排名)。
  • 隔离平台,彻底隔离开服务者和消费者,消费者不知道哪个服务者在为他服务,他所消费的内容,可能是由多个服务者所提炼出来的。服务者,也不知道他们所提炼的内容,有多少人需要,这些人都是什么人。
  • 内容消费者,按照所消费的内容付费。按照搜集的难易程度和内容的数量来付费。
  • 内容的提炼者,按照提炼的内容数量和质量得到收入,和订阅数量无关,每一个类型的内容,可以有三到五人进行提炼,并对其结果进行机器检查。根据检查的结果,可以给质量高的人,更多的收入。订阅数量多的类别,可以酌情增加筛选者的数量。

android, platform, robot icon这套系统的好处在于:消费者,可以在有限的时间内,看到他自己最想看到的内容。低收入地区,那些受过基本教育的人,也可以得到收入。
人工筛选,可以解决的问题:

  • 避免SEO的干扰。
  • 去除重复的内容。
  • 避免丢失重要信息。
  • 根据用户的需要,过滤广告和不实信息。
  • 在发生特定事件时,主动通知用户。
  • 将多个网站,通过不同角度报道的新闻,提炼出简介,并聚合出相对完整的观点,以及网络上的一些意见的统计结果。
  • 进行一定程度上的数据统计和分析。
  • 可以对一部分内容,进行人工朗读,以便用户在不同的环境中使用。

实现这种模式可能会遇到的困难:

  • 很难免费使用
  • 广告投放的效果比较难以确认
  • 在计算机的语义分析水平提高之后,可能面临巨大的成本压力

个人感觉,至少在现阶段,以及未来的三五年内,这种模式,应该还是有需求的。

1307519305_Green RSS reader

我和版权的故事

  • 第一次版权纠纷

离开同方之后,辗转了几家公司之后,进入了一家做人力资源管理和会议管理系统的公司。做程序开发。不记得当时的具体情况了,只记得突然有很多人冲进了办公室,说是要检查。好像是穿着工商局的制服,这些人在每一个人的电脑上翻找,并将可疑的内容拍下照片,再要求电脑的使用者签字。

后来才知道,这些人是查盗版的,他们有政府开具的执法证,到现场取证。然后,会由政府部门开出一定金额的罚单。

由于当时我电脑上安装的各种版本的盗版开发工具最多,于是就被公司勒令负责此事的沟通和处理工作。

最终的结果是,购买了一定数量的软件,并和软件厂家达成和解,最终避免了政府罚单。政府罚单的数额那实在是相当的恐怖啊。

这个事情的发生过程中,还是颇有几分中国特色的。首先:检查通常是针对单一厂商产品的,也就是说政府代表张三过来执法和主持公道,并不会管李四家的产品是不是被盗版了。如果被抓住了,态度比较好,有悔改的实际行动,并得到被侵权的软件厂商谅解的话,得到宽大处理的机会还是蛮大的。处罚不是目的,治病救人才是使社会变得越来越和谐的第一宗旨。

由于涉及到一些商业机密,这个事情最终如何处理和截止的,这里不便详细透露。

在这件事情处理完之后,当时我所服务的那家公司,依然在使用各种各样的盗版开发工具。现在,除了那些完全使用开源工具的团队之外,其他软件开发企业或团队,多少都存在着一定程度上的盗版使用开发工具的问题。即使被抓过了,也不可能买到人手一套的程度。

被抓过一次的公司,还会再被抓吗?这还真不好说,只能说由于盗版同一家公司的产品,在短时间内被连续抓两次的可能性并不是很大。但是今天被张三抓,明天再被李四家抓,这也算是正常范围之内的事情。

  • 角色的转变

在上门所说的那起版权纠纷事件发生之后的一年左右,我离开了原来的公司。去到当时抓住我前雇主盗版行为的那家国外软件开发工具供应商处工作。角色发生了180度的大转变。从一个侵权者,彻底变成了盗版的受害者。

作为一家盗版行为的受害公司,都采取了什么样的手段来维护自己的权益,并最终取得了什么样的成就,由于涉及到更多的商业机密,以及中国特色,还是不能详细说的。以后有机会的话,还是和大家聊一些能说的事情吧。那就是在我为这家开发工具供应商工作的四五年间,在不同的时间,通过不同的途径,和我的客户们,或者说是潜在客户们就一些涉及版权问题的对话和争论。

我和版权的故事——盗版小说之路

也就是差不多最早有网络的时候,我开始接触网络小说和MUD,后来随着论坛的普及,开始阅读盗版小说了。那个时候小说大部分是台湾那边出版的,比如说频和鲜网的小说。国内有一些论坛,就开始做起了盗贴的事情。好像是从2000年开始,也有人尝试着通过一些比较特殊的支付手段向台湾支付阅读费用,但是这种通道,直到现在为止,也不是非常通畅,毕竟图书属于一种出版物,而对于出版物,这边审核的是非常严格的。同时,台湾那边跑到大陆来维权,成本也是很高的,所以这种盗版台湾小说的现象一直到现在为止,也还是比较普遍的。

以前比较火爆的盗版小说站,后来都在逐步的寻找自己的出路。幻剑书盟一直在努力的尝试打通个人向台湾书商付款的通道,但是一直收效不大。有些网站干脆就一直走盗版路线,然后靠广告收入来维持生计。他们不但盗版台湾的书,后来大陆这边的网络原创文学兴起之后,也不遗余力的盗版大陆自己的书。

最终这些盗版小说站,发展向了几个不同的模式。

其中最成功的就是起点了,直接向读者收取订阅VIP章节的钱,然后再和作者去分成。起点早期也做过台湾盗版书,也曾经尝试着去向台湾书商付款,还尝试过依靠广告收入达到收支平衡。但是除了向用户直接收费所得到的收入之外,其他的几项好像发展得都不是特别好。现在可能还会引进一些台湾的版权,但早已经停止了将客户支付的费用直接支付到台湾去的尝试。我记得早期起点还尝试过一种叫做广告票的东西,用户在阅读的时候,如果觉得书写得不错,可以去点击广告票,并看到一些广告。这种方式,无法刺激用户的点击欲望,对于那些被点击的广告来说,用户也不是由于对他们的商品感兴趣而点击的,所以最后广告的效果肯定是极差的。

走起点这条路,最后基本上成为了国内所有正规,或者有正规化期望的网站的不二选择。但也还是有一些不走寻常路的家伙,比如有一些论坛还是存在了相当长的时间的,就像云霄阁、武侠屋等,最后这些论坛纷纷由于版权纠纷和收支无法达到平衡,而关闭了。现在还有做盗版文字内容的论坛,但是那种纯靠盗版小说生存的论坛已经不像以前那么多了,盗版小说通常是作为他们论坛中的一个板块,为他们吸引来流量。其中武侠屋,曾经尝试过要向正版付费阅读的模式去转移。但是,在这个过程中,他们无法下狠心将盗版内容都删掉,害怕影响流量和广告收入,最终还是没有活下来。起点、幻剑当时走这条路的时候,可是删掉了不少东西的。

现在,盗版网站也还是存在的,这些网站靠着盗版海峡两岸的内容,吸引大量的阅读点击,提供很完善的手机或其他各种移动设备阅读的服务。并从中赚得一定量的广告收入。这一块,他们确实钻了起点和其他正版付费阅读网站的空子。由于盗版和反盗版的斗争,在这块阵地上一直都是很白热化的。手机等移动阅读设备,由于其自身条件的限制,所以很难实现什么特别有效的防盗版手段。而且,现在使用手机等移动设备进行阅读的人们,他们的阅读习惯又和各种防盗版手段有着比较大的冲突。所以那些付费阅读网站在移动阅读这一块一直是抱着一种非常审慎的态度,他们宁肯不做这一块,或者是将这一块的防范做的更严一些,哪怕是牺牲一些用户体验,也不希望盗版书商从这一个途径将他们的内容盗出去。这就导致了像飞库那样的主要为移动阅读服务的盗版书城很是风光的存活了一些年。不过这个书站,现在应该已经不在了。这一类的书站,随着盛大文学都大型正版书站自己在移动阅读领域的不断拓展(云中书城、Bambook电子书、云城Android版、IPADIPhone版、盛大文学和移动运营商直接合作等),以及对盗版书站打击力度的提升,在不断的消失。不过这种站是很难打干净的,毕竟搭建的成本非常低,而且,收益也还是不错的。

论坛和贴吧之类的地方,一直是盗版内容的重灾区,但是由于论坛上面的流量不会特别大,论坛是一种时序性质的交互平台,在不使用搜索引擎的情况下,很难找到所需的内容,即使是有整理贴,通常也是需要注册登录等验证手段才能得到所需内容的。即使是盗版网站,也怕盗版的,他们将防范措施做得越来越严,最终限制了网站的流量。这里面比较麻烦的是贴吧,贴吧对大量内容进行了聚合,大家通常是依靠搜索引擎来使用贴吧的,这导致了贴吧的流量巨大,特别是百度贴吧。里面的内容非常完整,背后的监管相对比较宽松,流量巨大。对很多正版付费阅读书站造成了巨大的损失。而且,由于其背靠百度,打击起来还非常的不容易。不过这一块也有一些好的现象,那就是百度在文库的争议中,败下阵来,现在文库里面的盗版内容总算是少了一些了。在百度和盛大文学的诉讼中,百度也败诉了,虽然才需要赔50万(国家规定,此类纠纷的赔偿上限是50万,完全是脑子进水的人制定的这条法律),但是这其中的象征意义还是很大的。

现在这个领域中还有一种新生事物,那就是垂直搜索引擎,这些网站自己不保存任何内容,只是提供盗版内容搜索。并利用避难所漏洞,钻法律的空子,逃避惩罚。这种东西,现在虽然造成的损失是很大的,但是如果有打盗版的人,顺着垂直搜索引擎去寻找盗版站,那个时候,这些垂直搜索引擎带给盗版站的就不再仅仅是流量了,还有巨大的风险。到了那个时候,盗版站就会设法屏蔽这些搜索引擎,他们甚至会去屏蔽百度、谷歌等传统搜索引擎。到了那个时候,这种搜索引擎就不再是盗版站的朋友,而是他们的敌人。这些垂直搜索站也就不攻自破了。

盗版小说网站,肯定是不会绝迹的。但是随着打击力度的提高,那些小网站会逐渐变越来越封闭,除了自己原有的用户之外,很难再吸引到新的用户,通过搜索引擎进入他们的网站,而原有的用户也会不断的流失。对于百度贴吧或文库这种大型的盗版站来说,斗争的路还很长。

 

下一篇争取写一写我所在的公司,第一次由于盗版而被抓现行的故事,以及我自己如何从一个盗版用户变成了版权维护体系中的一员,并在维护版权的过程中,发生的一些和用户之间的争吵。本文所涉及的所有内容,都是从个人角度出发,不代表任何公司立场,所了解的信息可能也不是很完整,但我写的就是我见到的和听到的事情,而不是记录史实,如果有什么地方有些出入,也请不要太认真,大家就当故事来看吧。

我和版权的故事

作为一个程序员,软件行业的从业人员,IT行业的从业人员。版权和我的关系好像还真的是蛮大的。这里就不阐述什么是版权了,只是讲一讲入行十几年来遇到的一些比较有趣的,或对我影响比较大的版权故事吧。

第一次知道有版权

那是上大学的时候了,作为一个软件专业的学生,喜欢玩儿各种软件,肯定是无可厚非的。我是91年上的大学,印象里是到93年开始四处去复制软件的。最早使用的是vax11750的小型机,在那种东西上,很难有软件的概念,面对着一个闪着绿字符的终端,那个键盘叫结实啊。除了自己编写的实验代码和编译结果,剩下的好像就都是命令了,根本就不是文件。所以也就没有软件的意识。

后来开始使用PC机才发现,软件原来是可以安装、可以复制的。Turbo CTurbo Pascal,以及各种版本的DosFoxbase等等,还有当时著名的wpsucdos等中文字处理软件。非常神奇,非常有趣。

当时有人提供收费复制,软件按照所需的软盘数量来付费。曾经有个悲剧的家伙:我的一个同学,复制了一套九十几张软盘的SCO UNIX,安装了一整夜,到八十多张的时候,发现软盘坏了。那才真叫欲哭无泪呢。

那个时候,我知道了有软件,也知道软件是有版权的,但是从来也没有关心过一套正版软件到底应该是多少钱,只是知道复制这些软件,需要付出辛苦的劳动,软盘复制也是一件很烦的事情,当时有一些很有名的软盘复制软件,由于可以将那些加密的软盘复制出来而广为流传。复制和安装软件也是一件非常辛苦和麻烦的事情。当时软件和内容基本上就是属于我们这些计算机软件的从业人员的,对于圈子外面的人来说,这些东西距离他们还太遥远了。

其他的内容,当时盗版起来也不是很容易。

盗版光盘

后来有了光盘和光驱,软件的流行变得容易了起来。盗版光盘也第一次将vcd带到了的寻常百姓的手中。再早都是租录像带看。复制录像带对于当时的人们来说,就像我前面所说的复制软盘一样是非常麻烦的。记得那时使用的VHS录像带,复制到第三遍就会失去色彩,也就是说彩色的变成黑白的,到第四轮,就彻底复制不出来了。

我印象里面最早的盗版光盘是15元一张。有些同学到美国去,他们会携带很多盗版光盘出去。VCD是在盗版光盘流行了一段时间之后才普及起来的,最早的光驱是1倍速的,而看VCD,必须要两倍速以上的光驱。所谓的1倍速,指的是播放CD的速度,也就是说能够正常播放普通音乐CD所需要的速度。后来的1倍速DVD指的是可以正常播放DVD电影所需要的速度,蓝光的一倍速,也是这么定义的。这也是为什么很多刻录光盘上,除了标注容量之外,还会标注一个时间值,CD-R通常标注的是87分钟。这就是说,按照这种容量的光盘,最长被使用的那种用途,可以记录这么长时间的内容。跑题了,总之,最早的盗版光盘,大多是音乐、软件和游戏。后来才有了VCD的。

记得那个时候还有一种很神奇的东西,那就是卡口带和卡口盘。据说是从国外走私这种东西的时候,被海关罚没的。然后在上面打一个大口子,也不知道是真是假。后来好像此类东西大多是小贩自己制作的盗版内容,然后自己打的口子。

说到盗版光盘,就不得不说一下我在同方光盘工作时的那段日子了。同方光盘里面有一个部门,专门是搞光盘生产线批文的。他们做的事情,就是将那些在南方被罚没的没有正规手续的生产线,拆回来,检修之后,办理批文和正规手续,再卖给那些需要的厂商。有一段时间,他们的生意非常火爆。那也是一群很有本事的人,他们可以将完全没有任何文档、手册、没有保修、缺乏配件的设备,拆回来。并且重新组装让其能够正常运转。从他们那里也流传出来了一些故事,比如:盗版光盘制造商,也是非常狡猾的。这些人,经常是将房子和机器一起搭建起来,比如:盖个房子,先盖一楼,然后在二楼的地面上安装机器设备,安装好之后,再盖二楼。有的则是先挖一个地下室,将机器设备安装好之后,再在上面盖房子。这就导致了,他们去拆卸这些机器的时候,必须先拆房子,然后才能将设备拆出来。

后来,我所在的事业部,开发了一种叫做光盘拷贝机的东西,那个东西长得就像是一个立式机箱的服务器,朝前的一面全是刻录机,里面有一个嵌入式主机和一块硬盘。可以自动的将内容复制到硬盘里面,并一次复制出七八张拷贝。我们做这种机器,买这种机器的初衷肯定是好的。但是不可避免的就是,后来有一段时间,经常会在电视新闻或打击盗版的节目中,看到有人抱着我们的生产的拷贝机满街逃窜,而身后则有人民警察或者是工商、版权的执法人员紧追不舍。

有了互联网

我记得,最早开始上网,应该是在96年的样子。那个时候开始有人使用调制解调器上网了。那个时候下载软件还是一件很麻烦的事情,主要是网速很慢,而且容易掉线。当时,也没有那么多需要下载的东西,软件下载站倒是开始出现了,但是由于带宽的原因,以及那个时候比较缺乏好的断点续传工具,P2P也还没有流行起来,所以对于软件和游戏的传播来说,最方便的方式还是盗版光盘。那个时候,开始出现大量的盗版游戏和软件光盘。

后来出现了P2PBT、网络蚂蚁、网络吸血鬼、电驴、迅雷等工具,下载软件和电影才逐渐变得流行了起来。再后来随着网络带宽的逐步提升,PPLive等在线点播和在线电视直播的网站也逐步的流行了起来。现在,国家大力的打击不容易监管的BT和电驴,最终使得比较容易监管的YoukuKu6和土豆之类的视频网站发展了起来。这些网站最早也都做盗版内容,特别是美剧(欧美的电视剧统称)。现在在打击和监管之下,已经收敛很多了。这些网站现在也开始做一些正版内容的引进,并搞一些付费节目,不知道现在付费观看的效果怎么样,并不是很清楚。因为我个人还是比较喜欢在移动设备或电视上看这些内容,不喜欢在电脑面前看,所以这类服务用得比较少。

现在,这些网站大多在大力开发电视观看设备和移动观看应用,估计在不久的将来,这些条件成熟起来,付费方便,并且内容充实之后,我还是会去选择付费看这些内容的吧。

 

 

 

 

这将是一个比较长的系类,讲述我和我身边发生的各种和版权有关的故事。这一篇就到这里了。下一篇我会写一些盗版小说的故事。本文所涉及的所有内容,都是从个人角度出发,不代表任何公司立场,所了解的信息可能也不是很完整,但我写的就是我见到的和听到的事情,而不是记录史实,如果有什么地方有些出入,也请不要太认真,大家就当故事来看吧。

连环画和微博的结合——续

上一篇连环画和微博相结合发出去之后,和一位同事聊了聊。觉得还有些地方没有说得很清楚。那就是这种应用应该如何起步,如何运营。

最近注册了点点网,看到了轻博客。很多人都觉得,微博的140字限制,是由于受到手机短信的限制。总觉的在微博和博客之间总还应该有一些中间地带。buzz和搜狐微博都是不限制字数的,但是这两个东西发展得都不是很好(纯属个人感觉)。原因很多,不知道取消了字数限制算不算是其中之一。

这里不讨论轻博客,还是说那种结合很多图片的微博。

如果有人想要做这种东西的话,一定要和现有的微博结合好,千万不能脱离现有的那些成功微博系统。

一开始可以以微博客户端和插件的形式存在。也就是说在普通的微博中,隐藏一个特定的短链接,对于新浪微博来说这些短链接还会再被http://t.cn 重新包装一次,不过这并不重要。当使用特定的客户端或网址来进行解析的时候,可以直接将这个短链接解析成一个图片的序列。

发送内容的时候,用户选择了多幅图片,上传之后可以自动生成一个竖排的缩略图,并根据用户的设定,将缩略图投递到各个绑定的微博账号上去,再在后面填上一个短链接。这里所说的功能和那些微博通之类的微博账号同步服务不同的是,要将完整的内容存放在自己的网站上,已备用户查阅。当有人点击那个短链接的时候,直接返回连环画微博网站,可以看到相对完整的文字描述和图片序列。对于回复和转发的消息,也可以在其中嵌入这种短链接,如果使用特定的客户端软件或网址来查看,那么回复和转发的信息上也就可以放置图片序列了。

这里就需要对同一个短链接的两种不同的解析方式,如果是各种微博官方的网站,或不支持这种连环画解析的客户端,则直接显示短链接。点击之后,返回连环画微博相应的条目。如果是直接使用的连环画微博的网址,或支持连环画功能的客户端,则直接解析为图片序列。

如果这一步能够做好,应该能够吸引到一些人来使用此工具发送带有图片序列的内容。很多用户会点击微博上的短链接,跳跃到连环画微博上来查看详细内容。其他人如果想要看到带有图片序列的回复和转发信息,或在回复、转发中添加图片序列,那么也会开始使用这种客户端。这样就可以达到网站和客户端推广的目的。

网站上要存放那些微博的信息,其中图片可以放到图床上去,只要保存文字信息,以及信息之间的关系就好了。关于图床的设想,我写了另外一篇博客,我会在后面放出来的。只存放文字信息,以及文字信息之间的回复、转发关系。至少在初始阶段,压力应该还不是很大,如果存这些东西都会有压力的话,只有两种可能:第一、程序写得太烂;第二、捧着钱找上门来的投资人,已经等在门外了。

除了收发这些内容之外,随着时间和用户的增长,这个网站会积攒下越来越多的数据。然后,就可以依靠数据挖掘和聚合功能,将图片序列,以及相关的文字描述,按照相关的时间、事件、地点等各种各样的分类方式聚合起来,推荐给那些想要看微博杂志的人。

网站上只存放内容,并不要求用户重新建立关系。关系还是保持在传统的微博体系中,甚至有人可以通过看聚合之后的内容,再去原来的微博系统中关注发帖人或相关人。这有利于原有微博体系中关系的传播和建立,对于那些想要提升自己影响力的人们来说,应该也是有吸引力的。

由于网站并不保存任何关系,所以其信息聚合之后形成的杂志,完全是让大家搜索和订阅的,和微博上的follow网络,没有直接的关系。

当系统建立起来,并拥有足够多的内容订阅者之后,就可以考虑让用户再在此基础上添加点评或digg之类的功能。这里所说的订阅者,指的不是那些通过连环画微博系统发送微博和阅读微博的人,而是那些直接进入连环画微博系统,搜索和订阅特定分类的连环画信息的人。这些点评和digg的功能,还是可以在那些专为传统微博开发的客户端上体现,让人们可以对微博进行一定的点评、分类和digg。即使人们不去做转发、回复和收藏,也可以做这些事情。在做转发和回复的时候,用户可以自己选择,是否将这些信息写入转发或回复的内容中。当这些信息积累到一定程度的时候,就可以根据这些信息推出更多维度的图集和网络杂志。为订阅者们提供更多的选择和筛选的途径。

信息本身是具有价值的,当信息聚集起来之后,这些价值会随之上升。信息的挖掘本身也是有价值的,搜索的结果、排序的结果、过滤的结果,这些东西本身都是有价值的,比那些无序的数据要更有价值。以后肯定会出现很多人,使用各种专业工具,来进行全职的信息挖掘。他们依靠搜索、过滤、排序,以及统计分析,从历史数据中找到有价值的内容,然后重新包装发布出去。

微博和SNS,所关注的是人与人之间的关系,这里所说的系统,主要关注的是信息之间的关系,以及通过这些关系组合起来的信息,在不同的颗粒度、不同的维度上所产生的价值。

对于连环画和微博的结合,这篇博文,是对前面一篇的继续,希望能够将实施的过程稍微的设想一下。当然,如果真的有人想要去实施这种东西的话,中间肯定还会遇到很多其他的问题。我并没有真的去实施过此类项目,所以这些内容绝对应该是属于梦想园的。如果有人想要对细节进行探讨,欢迎。如果有人指责其中有什么问题,也欢迎。但请先去看看梦想园的开篇,了解一下梦想园存在的目的。

连环画与微博的结合

现在,微博无疑是非常火爆的,有图片的微博,更是吸引大家的眼球。网站上,各种画报或幻灯类的应用也非常普遍。这说明用户非常喜欢分享和订阅图片、照片,或图片类的信息。现在的手机,大多具备照相的功能,ipad等平板电脑可以连接数码相机,现在ipad2也可以拍照了,那些能够进行照片拼接和变形的应用,也非常的受欢迎。
遗憾的是,和twitter不同的是,国内的微博,习惯于自己存储照片,这样做的好处在于方便进行统一的监督和管理,但是缺陷也有很多,比如必须占用很大的空间和带宽,不便于图片所有者的统一管理等。而且,现在的微博,只有原帖上可以加图片,加上去之后,就不可以再修改了。如果需要,只能将整条微博删掉。回复和转发贴上,都是不允许附带图片的。最讨厌的是,每条原帖,只允许携带一张图片,这就导致了,如果想要发送多张图片,就必须使用拼图软件,进行拼接。只有原帖才能携带图片,是国内微博的创造,twitter上是没有这种限制的。不知道当时做这种设计的时候,那些产品经理是如何考虑的?
常见的图片展示和分享方式,除了像微博那样,一次一张之外,还可以像幻灯片那样展示,以及像连环画那样,顺序的叠加所有的图片。我很喜欢连环画式的图片阅读方式,因为这样可以非常简单的顺序看到所有的图片,不需要来回的翻页。其实,这种连环画式的图片分享方式,是最传统的一种图片分享方式了。bbs论坛上面,就是这么做的。wordpress等博客系统上也是这么做的。
我这几天参加QCon的时候,发送了很多带有照片的微博,其过程是非常痛苦的。我先用尼康D80拍摄高分辨率的照片,然后使用IPAD上的配件,将SD卡里面的照片导入到IPAD。然后竟然发现新浪微博的IPAD官方应用有个bug,如果我直接添加一张千万像素的照片的一条微博里面去,点击发送的时候,这个应用会直接退出。最后只能下载了一个Photo Mess,对图片进行缩放和拼接。然后再将处理好的图片插入到微博中,才能发出去。

如果能够直接搞一种类似于微博的系统,专门让大家贴图片,其客户端可以直接选择多幅图片,并调整顺序。自动对太大的图片进行缩放,然后对选中的图片进行统一的色彩或色调的调整。再上传到一个专门进行图片存储的图床,最后将提交一批短链接给这个连环画微博应用。这个应用将生成唯一的一个图片序列编号,对应这些短链接,以及次序。当微博被订阅的时候,可以自动的按顺序调出这些图片,然后按照顺序和统一的宽度,显示这项图片。
发帖程序,可以先发送文字的部分,这个时候其他用户就可以看到这条微博了,随着照片的上传,那些订阅者面前的微博,将自动的显现这些内容。也就是说文字和多幅图片的传输和显示,是异步的。并不一定要完全传输完了之后,其他用户才能看到。而是其他用户可以直接看到当前已经传输完成的部分。其他部分,可以在传输完成之后,自动的显示出来。
该条微博的原创者,可以在微博发出后添加或删除其中的一些图片,也可以调整顺序,如果他拥有足够的权限,直接从图床上删除了一张照片,那么所有引用这张照片的地方,都将直接被屏蔽掉。所有微博的回复和转发,都可以再附加图片。
这种系统,如果有大量的用户访问,每条微博都需要调用多张图片。那么对于图床系统的压力会非常大的,如果要实现此类连环画和微博结合的产品,那么在前端就必须采用一些滞后渲染类的技术。如果像传统的bbs或博客那样,直接去调用多幅图片的话,服务器可能根本就无法支撑。
如果我们能够拥有这样这一种系统,当用户遇到一些突发事件,或有趣事情的时候,就可以连续的拍摄多张照片。然后选择这些照片,调整顺序和色调后,按照恰当的分辨率上传到微博系统上去。图片进入图床,文字内容进入微博系统。其他用户,可能从不同的角度,也拍摄下了同一事件的其他照片,那么他就可以在回复或转发该微博的时候,将他的图片也放进来。当用户阅读此微博的时候,就可以看到转发和评论的上下文,以及相关此事件的所有图片。这样的阅读体验应该是非常棒的,而且非常方便进行图片信息的聚合,也方便搜索。
希望能够有人做一个类似的系统,或现有的国内微博提供商,能够提供类似的服务。如果有人准备自己做类似的系统的话,可以考虑将多幅图片进行等宽拼接,然后将缩略图转发到国内外的知名微博上,然后再用链接将那些想要了解详细信息的订阅者,吸引回自己的服务器上。
最近事情比较多,前面写了一篇关于开源图床的博客,写起来也很痛苦。那篇博客已经写完了,但是还有一些问题,所以并没有发上来。这里所讲到的图床系统,就是基于那篇博客中的描述的,当然,放在flickr上也是没有问题的。那篇写开源图床的博文,也许会在今后一两周里面发上来吧。当然,也有可能会在那篇博客贴上来之前,再写一些其他的东西。

分层次的图片服务

春节休假归来,又向flickr上上传了一大堆照片。我在flickr上的那些自己人也都在努力的上传新照片。我想,每次重大的节日之后,flickr都需要增加一些新的存储设备吧。特别是中国的黄金周制度更是极大的增加了flickr的存储压力。

DSC_0355

flickr本身一直存在着很多的争议,他们的盈利情况一直不是很好,但是作为一个照片站来说,能够超越他的又确实不多。就像上一篇《图片的故事》中所说的那样,flickr这样的公司,运营压力是很大的,他们需要准备海量的存储设备和巨大的带宽,来应对图片的存储和调阅。他们在选择各种和Social相关的策略时都需要特别谨慎,因为他们所有的策略,都是建立在高昂的成本基础上的。

在图片行业,像flickr这样从头做到脚、融会贯通,可能并不是一个好的办法。现在,很多想要进入这个行业却又被flickr这个响当当的例子放在那里,吓得裹足不前的主要分为两种类型:有想法的小团队;有钱、有服务器、有带宽,却在策划上异常谨慎的大型企业。

11

如果能够让这两类人,分别做好自己的事情。那么我们就有可能能够看到大批的图片相关应用涌现出来。

首先说说那些大企业。

13

他们需要提供的就是存储和带宽,将其包装成商品,自己做一个简单的针对个人用户的demo,然后以API的形式开放给那些小型团队。按照各种资源具体使用的数量向小团队收费。可以考虑有一个基准的免费基线,超过一定使用量,或期限之后,才开始计费。可以将费用用广告展现或点击资源来置换。他们只要保证图片数据的安全性、可用性;对于存储在他们那里的图片数据进行简单的处理(不同精度、色彩的变形等),各种初步的数据统计和分析工具,到常用的图片分享网站的API封装(新浪、twitter、facebook、搜狐等)。然后按照账号体系让特定的人可以通过API上传图片,然后再让相应的人可以访问到相应的图片,保证全国的访问速度。最后按照实际产生的存储容量和带宽来收取费用。

这其实就是一种基于图片服务的云,只是没有必要像flickr和picasa那样将服务做得那么完善,主要也不是面向最终用户的,而是面向那些开发者和小团队的。

对于运营这样的项目来说,首先需要对成本进行精算,详细的核算存储和带宽的成本,然后划分成不同的套餐,吸引那些开发者或中小型团队将他们的应用建立在这些服务上。

再说说那些可以进行无尽的尝试的小团队吧。

14

如果不需要考虑前期的底层设施搭建,可以在用户数量还比较低的时候,尽可能的少承担相关的成本。他们要做的就是发挥无穷无尽的想象力,去充分的试错。用户数量提升之后,当广告收入已经无法抵偿存储和带宽成本的时候,也就差不多可以去写投资报告,四处去拉投资了。

如果能够统一一套标准,所有提供图片服务的大企业和使用这些服务的小团队都遵循。那么这个市场就有可能更快的成熟起来。

社会分工不断的完善,是社会生产力不断提升的标志。让我们一起来期盼不同的团队和企业,在不同的层次上共同努力,为我们提供更加经济实惠,更加丰富多彩的图片服务吧。

12

图片的故事

现在,有越来越多的应用,或服务商,都在做、或是想做图片服务了。几个月之前,还不是这个样子的。那个时候由于图片圈子的老大,Flickr那半死不活的生存状态,使得很多希望去做图像的团队,都望而却步了。更是有一些做图像的团队,被投资人扫地出门。

这一切,随着instagram的成功,而发生了翻天覆地的变化。又有很多的人开始想来做图片的相关应用了。

为什么会出现这样的故事呢?

Image(7)

    图片应用,或图片服务,其天然存在着很多的不同于其他类型应用服务模式的特殊性:

  • 图片的容量决定了,图片比普通的文字信息消耗更大的资源,不论是存储还是带宽。
    • 外链被所有的图片网站又爱又恨,没有外链的话,网站的吸引力和黏着度都上不去,打开外链的话,对于带宽又会带来巨大的压力。 2011-01-19大杂烩
  • 盈利模式模糊不清,也是图片网站永远的痛,现在常见的收费方式有三种,但是好像都很难达到收支平衡甚至盈利: 2011-01-19大杂烩
    • 免费,这种方式的网站是靠广告收入存活的。
    • 向照片所有者收取存储费用——picasa和flickr都是这么做的。
    • 向照片使用者收费,有些提供高质量广告素材的网站是这么存活的。
  • 图片本身的索引和检索,再利用不是很方便
    • 所有主流的搜索引擎都提供了图片搜索功能
    • 但是这些搜索引擎都是按照引用图片的那个网页的内容来进行搜索的 2011-01-11大杂烩
    • 网页描述不一定准确,很多网站为了提高或降低搜索命中率,对seo进行优化,导致图片的搜索的准确性进一步的降低
  • 图片的再利用不是很方便
    • 大家需要图片的目的是不一样的:
  • Image(5)[4]

  • 需要图片来修饰网站或其他视觉界面
  • 需要图片来增强文字或其他内容的说服力和表现力
  • 需要图片来辨认地标建筑或联系人
  •  
    • 不同用途的图片,被分门别类的存放在不同的网站中 Image(6)
    • 一张图片,特别是照片,如果想要用于不同的用途,这将非常困难。比如,想要把一张照片上的人像抠出来,作为联系人的头像来用,现在Google倒是提供了类似的功能,遗憾的是Picasaweb的网站被墙了,我们很难访问到了。如果有人想要将某张照片中的一部分抠出来作为网站上图标来使用,那就需要专业人士来帮忙了。
    • 这些照片被利用的过程没有被记录下来,很多人需要重复的去处理同一张照片,做同样的事情。
  • 我们处在一个最不适合做图片服务的地区,要为那些最不适合享受这项服务的用户群体来提供图片服务。
    • 天朝的网络布局非常不合理,很多资源访问起来的速度,比在国外网站上还慢。
    • 本来一个大型IDC机房就能够解决的问题,现在却必须要建立一大堆的CDN才能完成。图片服务上的内容,还是动态的,不那么容易进行CDN分发。
    • 网络上流行一句话,叫做有图有真相。但是通常,人们自己并不知道他们是否具备了了解某些特定真相所需的智慧,很多真相在公布之前,还需要先由有关部门来判断一下,如果不是那么容易理解的,那就还是不要公布了,免得大家理解出了偏差。牛逼的生活不需要解释

图片服务,说白了就是做三件事情:原始素材的保存和整理;图片的检索和发现;图片的再利用。

在这个过程中,应该考虑几个问题。

在进行自有图片的保存和组织的时候,内容是以图片所有者为中心聚集起来的。然后再以图片所有者的事件和时间、地点为辅助标记进行组合。最后,如果有可能的话,才会有图片所有者或其他人添加的标记,或者是自动人脸识别,以及其他机器识别所辨认出的可识别内容。这主要是因为,我们现在都是使用的数码相机,在一次旅游或其他什么活动的过程中,总是会产生大量的照片,但是,会被做标记的,可能只是很少的一部分。而计算机的智能图片识别系统,现在也还很难让人满意的识别出照片上的各种东西。这些内容会随着图片所有者自身的社交关系图来流转。

2011-01-11大杂烩

图片的检索和发现,是一个很麻烦的问题。用户在检索的时候,输入的总是一些文字信息。将其所想象的图片需求,用文字表达出来,这本身就是一件非常困难的事情。大家除了能够依靠社交关系,看到一些好友或好友的好友的图片之外,想要自己去找到所需的一些图片,这对于现有的系统来说还是一种艰巨的挑战。

2011-01-12大杂烩

图片的再利用,也就是图片所有者,或其他得到允许的人,对于这些图片的再次利用。将这些图片,进行再加工,并根据需要发布到各种平台上去。比如,转帖到自己的博客中去,或发布到微博,或作为网站资源,粘贴到其他网站,也可以是再去印刷、做其他用途等等。

2011-01-12大杂烩

图片服务,应该还是会有很多种,能够在这块市场上成功的机会的。关键是要认真的研究,自己到底是要为什么人,或什么应用模式来服务。另外,在这个地方,图片服务,真的不太适合那些创业小团队来做,启动成本太高。

2011-01-19大杂烩

这是图片故事的第一篇,下面还想说说我设想的一些图片服务模式。

LBS狂想

希望这是最近一段时期里面的最后一篇LBS相关的博客。在一个多月之前,突发奇想,想要写一篇博客来阐述一下自己对LBS这种新兴事物的看法。想要写一写自己心目中的LBS应该是什么样的。结果列出来提纲之后,越写越多,于是就只能将当时的那篇文章截断,决定下一周将剩余的部分写完,结果又失败了。最终的结果就是,这是第四篇了,终于写到了最开始我想写的那些我自己心目中,LBS应该做成什么样子的问题。这批博客的第三篇,有些人很喜欢,认为说出了他们自己所想的一些东西。但这最后一篇(我希望是最后一篇),不一定还会受人喜爱,因为这是我所想的东西。写博客的目的是记录自己的思想,有人喜欢固然是好事,没人喜欢,也是会写下去的。

跑题了,还是说LBS吧。这批博客的第一篇,我写了什么是LBS,以及我所看到的LBS现状;第二篇,写了当前LBS领域所应用到的技术,以及这些技术尚不完善的地方和希望的解决方法;第三篇,写的是LBS中的数据流动方式,以及如何通过数据的流转最终形成服务。现在,最后一篇,我希望能够写一写我心目中的LBS应该是一个什么样子的。所以题目是LBS狂想,完全是YY,是痴人说梦。特此提醒那些抱着严谨态度来看我博客的人,不喜勿入。

自动签到和自动信息收集

我所设想的LBS系统,在信息的采集和聚集过程中,是以自动信息收集为基础的。

LBS里面的L其实代表着两层意思,那就是用户的位置和用户周围那些能够提供服务的信息点的位置。这是两个不同的东西,大部分现有的LBS都会涉及信息点的位置,比如早期的大众点评,现在大众点评正在转型,准备将用户的位置也加进来。用户的位置,又分为三种,第一:自己的位置、第二:周围陌生人的位置、第三:朋友的位置。维络城提供的就是以信息点位置为主,用户自己位置为辅的一种服务模式,用户自己的位置,是由维络城的那个打印优惠卷的机器决定的,一个人站在那台机器前面,他通常只能选择机器附近的信息点,他不会知道周围还有什么其他的陌生人和他做同样的选择以及选择之后的感受,也不能知道自己的朋友在什么地方选择什么服务。上海有些维络城的机器上,打印出来的优惠卷只能到日本去使用,这个可能只是一种特殊的广告投放方式,这样做具体有什么意义,我还没想太明白。FourSquare模式,以及那些仿FourSquare模式的LBS系统,希望能够提供全部的四种地理位置信息,但是他们都没有找到合适的方式来收集这些信息,也没有找到如何利用这些信息的方法。

我一直希望的是以自动签到为主,手动签到为辅模式,用户带着手机在城市里面移动,基站会自动的记录下用户的移动位置和轨迹。完全可以把这些信息记录下来,按照用户的设定,分级之后,发送给不同等级的好友或粉丝,甚至是直接发布到其他的微博平台上。

切客系统中的市长或地主

现在很多LBS系统,为了能够吸引到更多的用户,在LBS中加入了游戏性。也就引入了市长或地主的概念。使得一些用户在多次签到之后,成为了一个地区的主人,但是由于缺乏这个地区真正主人的参与,所以这些自封的主人,根本就得不到任何的主人待遇。

我在以前的《社区畅想》,以及《社区化网络时代的创新》中,都曾经阐述过,社区就是真实社会在网络上的投影,那么LBS中的地主,也就应该是这个地区的真正主人。比如一个饭馆的地主,就应该是饭馆的老板,那些签到次数很多的客人,不应该喧宾夺主,而应该向真实社会中去一家餐馆光顾次数很多的那些顾客一样,成为饭馆的VIP会员。

如果将LBS的规则设置为:没有店主的确认,就成不了VIP会员。这样的话,店主和那些光临的顾客就会很好的互动起来。如果一个经常使用LBS系统的顾客希望能够成为某个饭店的VIP会员,那么他就要去向店主申请,如果店主还没有注册过这款LBS服务,他就会邀请店主登陆,注册成店的主人,然后这个邀请店主的顾客,就可以在店主确认之后,成为VIP。店主也会邀请经常来的顾客,使用LBS系统,因为这个游戏体系里面,经常来的人可以有更多的优惠,线上和线下的优惠。这样的话,店主和那些常来吃饭的顾客就都有得到了好处,并可以通过他们的互动使得店里面的生意更好,经常来店里吃东西的顾客,得到更好的体验。他们互相邀请,LBS系统中的用户也可以稳步的上升。那个店主可以通过LBS系统及时的发布和更新各种信息,顾客也能搞通过LBS系统来了解这些信息。LBS系统还可以为特定的商家,专门生成一个唯一的二维条码。商家可以将这些二维条码印刷在杯盘碗筷、餐巾纸、桌布或一次性筷子的包装袋上,以便下次有用户要来签到的时候,直接用手机摄像头拍摄一下就好了。

更有趣的是,顾客去餐厅消费的时候,经常会在标准的菜单之外,提出一些额外的要求,如果系统能够自动的记录这些信息,那么顾客光顾几次之后,自然也就有了宾至如归的感觉了。有些饭店的老板,能够记住一些经常光顾的顾客的各种习惯,并在下次顾客上门的时候,主动的去照顾这些习惯,这可以极大的增加饭店的服务体验。以前,老北京有一句话,叫做:”一堂、二柜、三灶”,讲的就是这个。一个饭馆中,需要一个堂倌,两个柜台算账的,三个灶上的大师傅。堂倌不是现在通常见到的餐厅服务员,而更像是现在的大堂经理。一个饭馆的灵魂就是堂倌,迎来送往,记住每一个常客的各种习惯、喜好和禁忌;细心观察每一个新客人,判断他们的喜好和习惯,并根据这些判断,来招呼客人,以及有针对性的向客人介绍店里面的新菜色等等。LBS系统应该是可以部分覆盖堂倌儿的功能的。后文中还会详细的分析通过一些场景带入,来分析一下老北京饭馆儿里面堂倌的语言,以及这些语言中所蕴含的老生意经。

享受服务的主体直接支付费用

以前的LBS系统,特别是很多国内的LBS系统,就是因为缺乏了店家的参与,才缺乏活力。那是因为这个LBS系统中的服务流程没有贯通,不论是店家,还是顾客,都没有得到真正有价值的服务。如果能够按照我所说的服务体系,将整个服务流程完成。那么,这个体系中的店家,就应该付费。如果是一个用户来到一个全新的城市中旅游,在得到LBS系统的伴随式服务之后,这个用户也可以是付费的。就像在美国租车的时候,汽车上面的GPS系统是需要付费租用的一个道理。

位置的排序

当用户想要发布一个精确的位置时,可以辅助进行手工的签到。但是现在的签到系统和信息点系统都存在一个问题,如果希望让用户进行手工签到,就必须将这个问题解决掉。这个问题就是,信息点系统,真的把信息所在的位置都当成点来处理了,这是错误的。比如,我有一次在北京的紫竹院公园里面,想做一次签到,并发表一些微博。结果搜索周边的信息点,只有一些饭馆儿,而紫竹院公园只登记了一个正门的位置。为了停车方便,我是从后门进入的,那个正门距离我非常的远,所以不允许我去进行签到。其实对于用户自己来说,他们签到的时候,并不一定是在一个饭馆儿里面,他们通常是在一个很大的区域内,并希望对这个区域发表一些意见。所以,信息点的位置,其实并不应该是点,而应该是区域。当一个用户要求主动的进行签到的时候,不应该按照远近将所有的信息点都列出来,那样的话,就会出现我上面所写到的情况,我站在公园的后门,列出来的都是后门附近的饭馆儿,却无法在公园的正门签到。很多大的建筑,特别是一些Mall,在LBS系统中,只会标记出停车场入口的位置,以及里面一些具体商铺的位置。那个停车场的位置,估计是从GPS导航系统的地图上复制下来的。

这里就提出了一个问题,POI也就是信息点系统,其实应该是信息区域系统,那些服务信息,并不在一个点上,而是在一个区域中。系统应该能够根据用户的使用习惯和当时用户所处的具体位置,对这种区域性的信息,进行重新排序。比如当前的位置是在室外(使用精度相对较高的GPS信号定位)的时候,那么就应该将当前用户所处的特定区域作为首选,然后是这个区域内的一些著名或比较容易辨认的位置,比如知名景点,或容易辨认的建筑等。比如我在颐和园,那么我拿出手机签到的时候,我希望排在第一位的是颐和园,然后是昆明湖北岸,佛香阁附近之类的词语,那些饭馆儿什么的,不到一定距离之内,就不要显示了。如果发现用户不在室外,而是在室内或使用移动基站进行定位,那么首先应该列出来的应该是周围的那些大型建筑或人流密集的地铁之类的地方。还可以根据用户以前签到的情况,来进行更进一步的排序,比如一个人在某个Mall的饭店里面吃过饭,而这个Mall又正好处在当前的定位覆盖范围内,那么Mall就应该排在前面,那些他去过的饭馆儿,也可以排在前面,然后是那个Mall里面的其他信息点。我在张江地铁站附近的圆环广场吃饭,每次想要签到的时候,得到的排序都是一样的,我想要签到的那些饭店,总是需要进行搜索,才能找到。我希望去吃饭的时候,如果签到的话,排在前面的应该是张江地铁站附近的圆环广场,然后才是我常去的几家饭店,再后面才是其他那些我不常去的饭店。

签到系统应该是为用户服务的,这个系统不应该是,至少不是主要给商户服务的。那么,如果在签到选择项目的时候,像国内某无良网站上那样玩儿竞价排名,那就是本末倒置了。如果用户希望系统能够推荐一个商户,这个时候可以去搞竞价排名。但是签到,实际上是要告诉周围的陌生人和用户的自己的好友,用户到了一个什么地方,以及在什么时候,在这个地方发表了什么意见。这是两个独立的需求,而且是互相矛盾的,绝不能混为一谈。

信息的组织与汇聚

自从那些搜索引擎公司逐渐成为大家关注的焦点之后,爬虫技术逐渐走入了人们的视野。很多商铺的信息,原来信息点上的那些信息,其实在前期是完全可以靠爬虫技术来搜集的,唯一和传统搜索引擎搜集信息的过程不同的是,需要将爬虫爬到的地址信息,转换成地图上面的位置信息点。Google就提供类似这种服务,当输入一个门牌号码的时候,Goolge地图会返回一个精确到地理位置信息。这个信息有时候并不准确,但是作为POI信息点的初始信息也很好了。可以先搞一些,然后再让用户自己去增加和校正。一开始没有必要搞得太精细,大城市和人口密集区域详细一些,其他的地方,有人开始使用LBS系统的时候,再逐步添加。

所有这些信息被收集起来之后,就需要发挥计算机系统的数据处理优势了。这个时候,可以使用一些简单的语义分析来进行信息的分类和组织。当然,类似于光合作用书店这种集餐饮、咖啡吧、购物和书店为一体的服务点儿,是很难进行区分的。然后,再根据用户的需要,向用户进行推荐。这样看起来像是在提供一个咨询服务,但实际上还是搜索引擎,只不过在搜索的时候,是按照一个基于位置的系统,对搜索结果重新进行了过滤和排序。

伴随式服务

上面讲解了我所设想的LBS系统的信息收集和聚集方式,下面讲一种我所设想的LBS服务模式。那就是伴随式的服务。

其实这种服务的形式并不新鲜,GPS导航系统使用的就是伴随式的服务。公园里面的电子导游解说系统,使用的也是伴随式的服务模式。

LBS系统其实在很多情况下,对于那些普通的用户来说,所起到的作用就是一个基于地理位置的咨询和顾问式的服务,实际上也就是一个导游服务。那么,如果一个用户走到了一个需要LBS系统来提供咨询服务的地方,通常都是这个用户需要寻找一个附近的服务机构,来解决自己的某些需求,这个时候LBS需要做的事情,就是确定周围是否有符合用户需要的服务机构,并将这些服务机构根据用户的喜好、远近、以及竞价排名之类的权重排序之后,推荐给用户。在用户确定要去其中的一家消费的时候,协助用户进行订位或排位。很多受欢迎的服务设施,在高峰期都是需要排位的,到那里傻傻的排队是很无聊的。LBS系统完全可以代替用户去排位,排位的过程中,用户可以继续在周围逛街。在快要有空位的时候,LBS系统自动通知用户前往服务机构所在的位置,如果需要的话,这个过程中还可以为用户提供导航服务。可以在用户排位或前往服务机构所在位置的过程中,帮助用户和服务机构进行沟通,将用户的需求记录下来,并转发给服务机构。比如点菜之类的事情,完全可以提前处理掉,进场就开始吃。这些用户的需求,可以记录下来,下一次再有类似的服务需要进行消费的时候,还可以拿出来进行参考。比如:上次您吃过他们这里的鲈鱼了,感觉还不错,今天店里来的鲑鱼非常新鲜,正好还有这家连锁饭店的总店大厨巡查到这里,这位大厨最拿手的就是酸椒鲑鱼,您是不是试试?

将用户的一些允许发送给店家的信息,发送给店家。店家可以在用户到达的时候,直接引领用户去享用他已经定制好的服务。在北京的老饭馆儿里面,堂倌是要喊堂的,顾客进来的时候,会主动上去打招呼,碰到不认识的男士,通常叫”爷”,他们嘴上说的,通常是:”爷,您来啦?今天想来点儿什么啊,爷?爷,您留神脚下,地滑。爷,您吃好了吗?爷,您慢走啊。爷,您常来啊! …… “,当一位熟客上门的时候,他们会主动上去招呼,比如一位做药材生意的张老板上门了,带着几位客户上门吃饭,他们就会上去说:”张老板,您可是老没来了?最近又做了几单大买卖吧?听说最近药材的行情不错啊?您发财也得记着多照顾我们这样的小本儿生意啊?您这几位朋友看着也都是做大生意的,今天几位光临真让我们小店里面蓬荜生辉啊。张老板可是咱们这的常客了,您几位是张老板的朋友,到了小店就是给我们的脸了。一回生二回熟,下次要再来,直接找我,小的给您留雅座。”,北京人,特别是老北京人说话罗嗦,这一大通乌七八糟的,我写着都觉得罗嗦。但是这里面的脉络是非常清晰的,首先这个堂倌叫出了顾客的名字或称号,叫的时候肯定还点头哈腰的,这就让带客人来吃饭的用户,感觉非常有面子。我有一次和几个同事去一个饭馆吃饭,由于我去的次数比较多,老板认识我。老板和我打了个招呼,吃的东西不多,最后还送了一道点心,那几个同事非常羡慕。我自己肯定也会感觉虚荣心得到了极大的满足。如果是带着普通的客户去吃饭,遇到了这种情况,那么我在客人心目中的分量,以及我所阐述观点的可信度都会极大的提升。这个堂倌在打过招呼之后,会点出这位老板是做药材生意的,而且最近生意的行情还不错。再然后,他会去恭维一下一起来的几位生面孔,并承诺这些人下次再来的时候,可以享受更高一档次的服务,这就是在为自己的店拉生意了。这些人,以后是不是还会再来不好说,但是如果其中一位真的再来了,那么他可能就会上去说:”哎呦,这不是王老板吗?,上次您和张老板一起来的,就是我招呼的,您还记着我吗?您看您,贵人多忘事吧?我可是老想着您呢。今个可是实在对不住您了,这不是正赶上饭点儿吗,雅座都坐满了,都是熟客,实在是不好意思让人给您腾位子。要不给您在大堂里面安排个消停点儿的地方,您看行不?前两天还看见张老板过来呢,最近生意还过得去吧?今儿的羊肉不错,您上回来点过的,不巧买完了,没吃着,今天您试试?”,这就是宾至如归了。吃完了,还会上来问问:”您今天吃得还合口味吗?要是有什么不满意的地方,尽管说,我去跟后厨说去,让他们一准儿照着您说的改了。”。

伴随式的LBS系统,就应该将这些功能完成掉,提前将客户的部分信息,发送给服务机构,那么这个服务机构完全可以将上面那些看起来罗里吧嗦,但是,其中蕴含着丰富老生意经的伴随式服务,完成好。让客户的体验、满意度和黏着度都上升。

LBS系统应该在消费完成之后(可以通过位置的变化来判断:比如来到室外,或移动超过一定距离),也可以在用户询问下一项服务需求的时候,主动询问用户,对刚才所享用的服务的感受,可以根据用户的设定,将这些感受发送给店家,开放给来这家店消费的其他陌生人,以及用户的亲朋好友。

在伴随式服务的过程中,店家和用户都是有可能付费的,如果一个用户来到了一个语言不通的国度,选择了这种伴随式的服务,并且愿意支付费用的话,那么直接在Call Center里面,给他配一个真人版的在线导游也是可以的。

总结

我在LBS这个领域的想法还有很多,这里就不一一细说了。特别是我所设想的LBS服务模式,还有很多,这里只是举一种和目前流行的LBS系统比较相近的来说一下。基于位置的微博系统,基于位置的社区系统,基于固定位置(通常位置是变化的,但是家庭和邻里之间的位置是固定的。维络城的优惠卷打印机虽然是固定的,但是使用这些打印机的用户是流动的,这种是不能算的。)的社区系统等等,还有太多的东西可以写。这里就不展开了。那些东西,近期也不会再写了,以后什么时候再有更进一步的想法时,再一篇篇的写吧。后面,可以考虑换换口味,连着写了四篇LBS,希望下次能有些新的东西写一写。

Close Bitnami banner
Bitnami