ITBear科技资讯

云知声副总裁康恒:多模态 AI 芯片支撑物联网人工智能落地

日前,在2019全球人工智能创业者大会上,云知声联合创始人兼副总裁康恒博士在《物联网人工智能的落地路径》的主题演讲中表示,IoT结合AI化浪潮,需要全新的AIoT芯片,多模态AI芯片是关键一步。

康恒表示,AI与IoT的叠加要求传统解决方案朝五大方向转型:从通用架构到AI架构、从依赖硬件到软硬件一体、从PPA模式到垂直场景模式、交互从单模态转向多模态、设备从独立到协同。

C:\Users\admin\AppData\Local\Temp\WeChat Files\722924520281289633.jpg

康恒认为,万物互联已经成为大趋势,从计算机、手机、平板、手环等,到工业、汽车、家居,联网设备的数量在2014年到2020年间的年复合增长率预计将达23.1%,到2020年物联网设备数量达到501亿。百亿级联网设备将带来数据爆炸式增长,IDC预测2020年全球数据总量将突破40ZB,达2011年的22倍。

进入AI IoT时代,数据将呈现爆发式增长。这些数据必须通过AI计算进行提炼,产生数字机构化信心,才能为人类所用。“物联网的落地,有大规模的设备出现,而且这些设备会呈现一些多样化、碎片化、长尾化的趋势。AI交互成为内生的需求。”康恒博士指出。

“在智能家居领域,云知声是首家做智能家居语音交互的企业,同时率先提出了一系列智能语音的测试标准,在5米范围内能够轻松实现人机交互,目前仍是业界公认的通用测试标准。云知声在智能医疗领域,是国内首家推出医疗云服务的企业,并完成近百家医院系统语音测试。” 康恒认为,云知声和语音识别领域的领先企业科大讯飞选择赛道不同,科大讯飞更多把语音业务集中在企业服务和教育行业,云知声选择IoT、消费类场景,智能硬件,该公司认为,AI服务行业的可选择面非常宽广。

AI芯片落地要和场景密切结合

成立六年的云知声,开始在AI芯片领域发力。作为一家专注于语音领域的人工智能公司,云知声早在2015年就有了打造芯片的想法,并且开始组建团队。2016年,云知声正式宣布研发芯片,2018年5月份,雨燕发布。

为什么一家初创AI企业选择做芯片?众所周知,过去做芯片的企业都需要非常长时间的积累,芯片行业的技术难度、人才高度、资金难度都是挑战。云知声是怎样考虑的?

康恒强调说,在AI行业不做芯片,前途不明朗。“我们看到以纯粹软件的方式,甚至说以平台化,或者以云端服务的形式,这些方式越来越不可能去跟垂直行业做深度的结合。第二、做芯片,如果做不出好的芯片,AI落地应用是无法完成的。一旦AI芯片完成了,可以给自己树立一个门槛。增强自身的竞争力。”

最开始,云知声选择做通用芯片,很快发现了通用架构在AI落地中遇到三大挑战:1、及时性、带宽成本和无网状态下,需要边缘算力来解决;2、在保障边缘算力的前提下降低成本;3、功耗不仅涉及芯片,还与场景、应用和算法有关。从数据维度,不仅处理用户的联网数据,还有传感器获取的语音数据,环境数据等等,在给定成本和功耗的情况下,通用架构是否能够达到很好的效果;新的硬件基于深度学习的算法能够满足要求。通用AI芯片显然掣肘众多。

C:\Users\admin\AppData\Local\Temp\WeChat Files\619872258977533697.jpg

在康恒看来,云知声同时具备算法、场景以及芯片设计方面的三个关键要素,因此有条件产出物联网场景下最好的AI芯片。

芯片的发展与最初选择技术落地场景紧密相关,雨燕由云知声自主设计研发,同时包含了通用CPU、AI加速器(DeepNet)以及数字信号处理器(uDSP)架构,采用自主AI 指令,面向语音AI场景,支持6个模拟/数字麦克风接入。康恒提到,深度神经网络性能较通用方案提升超50倍。据悉,雨燕在智能家居方向分为两种方案,分别对应智能音箱和智能家居。

云知声向客户提供软硬件云+端一体化的解决方案是最常见的合作方式。此前,在白电领域大规模出货的智能硬件模组就是以这种方式为不少大公司服务,诸如美的、格力等等。

物联网落地的过程中,需要把算法跟互联网的硬件去结合起来。即把算法、应用程序放到芯片上。“云知声选择了软硬结合路径,云端芯一体化展示。我们把算法、云端能力和本地的应用程序结合起来,以一整套的方式推给客户。“康恒分析说,”这个路径最大的优点是,客户不需要再做芯片选型、算法移植和软件设计。云知声提供的解决方案已经是充分的测试过,推动客户整个的研发过程会大幅度缩短,快速帮助我们的客户进行产品的量产化。

交互模式转变引领厂商从单模态AI芯片向多模态AI芯片演进

人机交互只是依靠语音交互,是否足够?康恒的回答是,单模态语音的方式是无法实现真正的人机交互。只有语音没有图像,就像一个瞎子。

“云知声的技术路线要从单模态AI芯片变为多模态AI芯片,支持语音、图像、视觉环境,环境感知。多维度的传感信息结合起来,去实现主动的、智能的交互模式。这就是我们下一代芯片的设计的来源。”康恒强调指出,“当然,多模态需求下提供更好的芯片制程。”

云知声提出了AI On Chip概念,打造了DeepNet2.0多模态神经网络处理器IP,兼容多种神经网络。应用该成果,云知声实现了超听限同向降噪等技术。云知声今年还将基于该IP推出新的AI芯片“蜂鸟“。

雨燕是语音行业的一颗通用芯片,云知声把更多的冗余裁剪掉,让语音更专业,往专业化上走一步,这意味着蜂鸟的定位更加轻巧、灵活,可以持续降低客户的门槛,甚至将语音模组降低到一个更适宜市场接受的价格区间。

2019年,无论AI芯片,还是AI技术落地,已经走向一个深水区,智能家居、智能车载、智慧医疗领域,云知声都在不断切入。以语音识别在医疗领域的应用为例。云之声在医疗行业做了蛮多的工作和尝试,为医生提供电子病历的语音录入,原来一天需要4小时的病例录入缩短到2个小时,准确率达到95%以上,到了今天,已经有超过500多家医院在跟云知声合作。

“智慧城市场景中,云知声从家庭和出行出发,未来进一步延伸到社区,现在我们提供的智能语音服务主要是控制家居里面的设备,比如智能电视、智能空调等,未来我们可以将这个设备连接社区的服务,将社区的线下服务变为社区的线上服务,我们关注的是最终用户。“康恒最后表示,“云知声的优势是优质的AI团队,我们打造的多模态芯片和AI技术,都需要比同行做得体验更好,价格更优,未来才能在更多的场景运用中得到拓展。”

读者交流

扫二维码加ITBear科技数码群,大咖随时在线与你聊科技!
不方便扫码可加微信号:17091359999,也可以长按上图保存图片->微信扫一扫->点击右上角相册->选择刚保存的二维码。(如果在微信中打开此页面可以长按二维码识别)


本栏最新
全站最新