混凝土的热膨胀系数:更聪明的“听说” | 《商业价值》杂志

来源:百度文库 编辑:偶看新闻 时间:2024/04/26 14:08:04

更聪明的“听说”

作者:方世彤 | 发表时间:十一月 - 11 - 2011 | 分类:视野

很多技术本身并不难,难的是技术之后的大规模普遍商业化。

“我可以送你回家吗?”

“太好了,不过我是要坐奔驰车的哦。”

“我们去吃饭吧。”

“好的,出门左拐,两百米外的酸辣粉是我的最爱。如果你用手机签到,还能打八折。”

iPhone 4S 上市,大家听说过、没玩过的Siri迅速成为众人调戏的对象。这样的用户体验确实不错。一个会听懂你说话,同时能和你对话的应用一下子博得大家的好感。舆论评论说,许多人将会因为这一项应用而用iPhone 4S替代iPhone4。

这一次又是苹果点燃了这场语音识别的大火。

拥有众多语音识别方面专利的公司Nuance现在大热,网上热传他们和谷歌,或者苹果都有紧密的关系。毕竟人家拥有许多专利,和这些公司在语音方面有交集也非常正常。现在连我们国家的中兴通讯也证实正在与Nuance紧密合作。

QQ2011正式推出,其中的输入法就提供了听读,虽然反应速度还嫌慢些,但也算是赶上了这个潮流。把早已推出该项技术的“科大讯飞”的市场之路又给挡住。语音识别算不上什么新鲜的技术,正如触控当初也不算什么新鲜的技术。李开复博士曾经研发的Sphinx就是世界上最早的语音识别系统。

但是如果拿原始的那些技术给消费者,却是真要折磨死普罗大众。早先微软的Windows 7推出,就提出可以使用语音命令。但是由于这项功能挺傻的,谁自言自语工作呢?所以这项功能没有普及。而在导航仪上能使用语音的功能更是用之者寥寥。只有当这些技术以适应普通用户体验的方式呈现时,这些技术才能迅速地普及开来,并深刻地改变某些产品领域。

这是一个古老的命题。改变这一切的还是苹果,还是乔布斯。借助iPhone4S“听说”正在成为一项被市场追捧的,继触控之后的又一项超级用户体验工具。换句话说,如果不是苹果和乔布斯将这项十多年前就已经出现的技术,运用到淋漓尽致。“听说”远不会有今天受人追捧的成就。

除此之外,在音乐识别方面,MusicHound是许多音乐爱好者的最爱,这项iPhone和iPad的应用能够识别任意音乐片段,并提供相关信息及Youtube等网站上的播放链接。更妙的是你哼唱的话,它也可以识别。而另一项应用Shazam也具备同样的能力,不一样的是,人们为它寻找到了与听音乐不一样的应用,并且成功地推向市场。这就是“听广告签到”。Shazam可以听到广告内容,在识别的过程中,可以为开启此项应用的用户提供优惠券,积分等奖励。使得这项技术获得市场的认可,并且得到推广与普及。

早前一家名为IntoNow的公司推出他们听声签到技术(即听电视节目的声音实现电视节目签到技术)不过三个月就被雅虎公司以迅雷不及掩耳之势收购。这其实正说明此项技术正被业界紧密的关注,但凡有一点突破和特点,就会被大公司迅速招安。而大公司背后一定是要推出更加符合用户体验需求的产品。我们有理由想象这项技术在广告方面的作用。它能为广告主提供精准的客户,并进行精准的B2C营销服务。而这里面的价值确实将会是非常庞大的。

在图形识别技术方面,人类的研究已经快到一个顶点,从早期的条形码识别,到后来的二维码识别,再到彩码识别,识别从有形到无形,几乎无所不能。而这些的进步无一不是在改善着人们的用户体验。而笑脸识别,任意图形识别,AR技术都在带来一些全新的应用和人们对看的体验的革命。联想去年和一家国外公司合作推出了肢残人使用的笔记本电脑,能够用眼球的运动来控制鼠标。这样的应用立时得到市场的积极反应。而这样的技术也给残疾人带来了更好使用电脑的福音。而在近日发布的安卓4.0更创新地可以实现人脸识别启动手机的功能。

我们见证的是用户体验的不断被满足,人机互动越来越流畅。而这些体验的满足与不被满足的界限往往只是在一两秒之间。如果听你的声音,再识别,并能够回答你的时间过长,你绝对不会喜欢的。但是为了缩短这样的时间,研发人员必须要想出许多办法。而我们以前总说某某技术不难,我们谁谁都可以做。但是真到了产品阶段,却难以产生令用户买单的结果。这显然正在改变我们的固有思维,正在告诉我们,不成功的原因。

整个IT业的发展历程更像是个人机对话的提升过程,从最早的各种语言程序,到后来的可视化的操作系统,再到今天的云计算,图形及声音的识别。我们正在用这些人机对话来改善我们在传统业务中的操作。以广告为例,它将从原来的浪费式刊出形式,转变为更加人性化的贴身服务。从Siri聪明的回答中,我们可以想象的是众多广告主将要夺取Siri话语权。