ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

语义识别难住中国Siri 商用前景仍不明朗

时间:2012-04-05 13:15:14来源:搜狐IT编辑:星辉

Siri最难的技术不是语音,而是语义识别。(TechWeb配图)

Siri最难的技术不是语音,而是语义识别

4月5日消息,“Siri是催化剂,但是能否修成正果尚需时日。” 小i机器人董事长袁斌对TechWeb表示。

自从去年10月,借助发布iPhone 4S之势推出Siri语音问答系统以来,全世界都掀起了一场语音技术热潮,这些长期被边缘化的公司瞬间成为了市场关注的焦点。前有Ciriis和Airi,后有科大讯飞的“语点”。

被资本市场高度热捧的是市场是机会还是陷阱?目前下定论显然有点早。

过去的一个月,TechWeb走访了国内众多从事语音技术的公司,发现这些Siri的跟随者们都面临的共同问题是,听得懂你在说什么,却不理解你在说什么。至少目前来看,语音市场距离大规模商用依然有不小的距离。

这个问题的出现并不意外,因为即便是苹果的Siri同样困扰于此。近日,Siri在国外遭到了多起诉讼,原因是Siri无法准确理解用户的问题,苹果涉嫌夸大宣传。由此可见,如果Siri尚且不够完美,那么中国的Siri必定还有更多的路要走。

“最后的礼物”不完美

2011年10月,苹果iPhone 4S发布,虽然iPhone 4S无甚亮点,但其配备的语音控制助手Siri一经发布便艳惊全球。被称为乔布斯送给这个世界“最后的礼物”。

这是苹果唯一一款打上Beta标签的产品,但却承载了巨大的期望。苹果可以借此机会创建一个人工智能程序的生态系统,将Siri做成平台,让Siri与其他程序结合,Siri本身将成为入口。其结果是谷歌的搜索形式将被颠覆,用户可以通过更自然的交互方式直接获得答案。《纽约时报》撰文称:Siri代表着苹果的商业未来,也预示着未来“搜索”的形态。

虽然苹果有长远的规划,但Siri的发布还是略显仓促,实现这些美好愿景尚需时日。Siri所具有的发电子邮件、播放音乐、安排会议等诸多功能用户使用频率并不高。最新的一项调查显示,30%的用户从未使用Siri来发送电子邮件,32%的用户分别表示自己从未使用Siri播放音乐。对Siri表示非常满意的用户只有55%。

本月早些时候,纽约iPhone 4S用户弗兰克·法齐奥(Frank M. Fazio)在加州联邦法院提起诉讼,指控苹果发布的广告中对Siri功能的描述存在“误导性和欺骗性信息”。另一位iPhone 4S用户大卫·琼斯(David Jones)在美国加州库珀蒂诺对苹果提起诉讼,指控苹果错误地描述了Siri功能。“Siri要么无法理解原告所提出的问题,要么在经过长时间等待后提供了错误的答案。”

语义识别之难

为什么Siri会有这些不完美?国内从事了十年智能网络机器人研究的小i机器人董事长袁斌解释称,Siri最难的技术不是语音,而是语义识别。

我们现在看到的Siri实际上由两部分组成,一部分是语音识别,一部分是语义识别。当用户对Siri讲一句话时,语音识别分析出这句话说的是什么,语义识别分析出这句话是什么意思。语音和语义两部分技术在Siri中所占的比例分别是20%和80%。也就是说,要正确理解用户的意思并作出反应,语义识别实际上更为关键。

脱胎于美国国防部技术的Siri真正擅长的是语义识别。语音识别部分,Siri选择跟语音识别引擎Nuance合作。Siri现在的任务是不断加强其语义识别能力,建立更加庞大的数据库。据说苹果已经在印度招大量工程师进行数据库的梳理。

语义识别的另外一个挑战是,内容越多,对智能识别的挑战越大,需要的算法更强。

从事了多年语音技术研究的李开复也表达过类似的观点,他说:“人们一旦开使用语音跟你交流了,就会把你当做一个人,这个带来的超级高的期望值会给语音带来很大的挑战。”

Siri不适合创业公司

Siri的火爆让不少国内的创业者非常兴奋,因为它代表着一个可以探索的新方向。但是不少业内人士对此表示怀疑态度。

李开复曾在微博中称:"中国Siri’创业计划不太适合中国创业公司,需要解决的问题很多也很棘手,主要是新的智能语音控制技术如何引导用户行为,再是克服海量数据学习门槛和应用整合困难等。”

国内现在已有的类Siri应用,Ciriis和Airi,尚且都停留在娱乐层面。而前段时间科大讯飞高调发布的“讯飞语点”也并未有实质性突破,如果一句话中间增加停顿,它便无法正确理解。

袁斌认为,要做中国的Siri,第一需要语料库,第二需要人工智能的算法。讯飞拥有前者的优势,但后者仍需积累摸索。“需要长期的、系统的平台去处理每天进来的海量的知识,经过长期的集聚,形成工程化的产品,最后才能对每天进来的知识进行去重、筛选,同时能够学习新的知识点。”

在这一点上,袁斌的小i机器人有值得借鉴的经验。

小i机器人是一款网络机器人,主要应用于运营商、银行等的网络客服系统。小i机器人从2001年开始开发,最终以IM聊天机器人的形式推出,经历了个人用户激增、产品线众多、用户满意度下降、公司负担过重等一系列问题,最终艰难转型。而这些问题与今天的Siri以及类Siri应用面临的问题非常相似。

袁斌认为,无论谁做语音控制技术或者智能识别技术,这些问题都无法绕开。解决了,则柳暗花明,解决不了,只有死路一条。

更多热门内容
不负全球玩家期待!全AI掠夺者家族50系新品重磅开售!
在高端电竞本领域,掠夺者一直以先锋姿态引领行业发展,全新掠夺者·战斧18 AI等新品在CES 2025展会一经亮相,便将2025高端AI电竞本的期待值拉满。超前的设计理念和以玩家体验为核心的产品思路,贯穿掠夺者三款重磅新品:从发烧友的终极梦想至尊机皇掠夺者·战斧18 AI,

2025-06-06

餐桌底下的清洁高手!萤石云视觉商用清洁机器人BS1革新食堂清洁模式
在智能化浪潮席卷商业领域的当下,清洁行业正迎来一场革命性变革。2024 年,萤石首款云视觉商用清洁机器人 BS1 正式亮相市场,凭借前期先锋客户端的试运行测试及系统深度对接,迅速在全国各大写字楼、展厅、银行、食堂、酒店等场景崭露头角,开启智能清洁新篇章。AI 视

2025-05-23

京东新品国补立省 潮玩新次元游戏本华硕天选6 Pro来袭
5月16日京东新品日,打开京东APP来新品频道,买华硕天选6 Pro新品享国家补贴20% #京东新品 #京东重磅新品日,到手6999元起。华硕天选6 Pro搭载RTX 5070笔记本电脑GPU,至高可选AMD锐龙9 9955HX或Intel酷睿Ultra 9 275HX高性能平台,采用全新模具和散热系统,集卓越性能

2025-05-19

一加官宣首次将风驰游戏内核写入天玑平台,并与MediaTek联合发布天玑9400系列新芯片
2024年5月14日,一加宣布将与MediaTek联合举办“芯旗舰 新上限”游戏战略沟通会暨芯片发布会,双方将在游戏技术共融、芯片定制、内核重构、技术联合等多方面展开前所未有的深度战略合作。一加将自研的芯片级游戏技术「风驰游戏内核」首次注入天玑旗舰芯片,让游戏体验再破

2025-05-13

MiTAC 神雲科技发布搭载最新AMD EPYC™ 4005系列处理器产品
【加州纽瓦克电—2025年5月13日】—作为专业的服务器设计与制造商,神达控股股份有限公司(股票代号:3706)旗下子公司神雲科技股份有限公司(MiTAC Computing Technology Corp.)推出了支持AMD EPYC™ 4005系列处理器的最新产品。这些更新的服务器解决方案可提供更高的性能和

2025-05-13