一家 AI 公司的多模态场景突围:软硬结合,端云互动

AI百科4个月前更新 快创云
40 0

  半年前,云知声发布了首款面向物联网的AI芯片雨燕(Swift);半年后,云知声宣布了多模态AI芯片战略,并曝光了正在研发的三款AI芯片:第二代物联网语音AI芯片雨燕Lite、面向智慧城市的支持图像与语音计算的多模态AI芯片海豚(Dolphin),以及面向智慧出行的车规级多模态AI芯片雪豹(Leopard)。

  自2015年确立芯片项目并组建团队以来,云知声在2017年进入“造芯”项目的攻坚阶段,并在2018年1月完成了首个MPW(多项目晶圆)的制作,同年5月发布了首款芯片,6月启动量产,9月发布了基于雨燕的开源方案。在此期间,芯片设计团队从语音技术转战至图像IP设计。

  随着技术和场景需求的叠加,AI芯片的边界发生了微妙变化。2015年,云知声决定做硬件时,为此在深圳设立了分公司。一套完整的芯片开发过程相对漫长,期间不可避免地会涉及算法迭代,影响芯片的研制速率。雨燕从设计到研发,直至最终量产,时间周期为3年。云知声联合创始人李霄寒表示,要保证2015年立项的芯片仍适用于当下主流的算法,这项任务无疑是艰巨的。团队凭借经验对算法进行预判之外,还需拿出勇气和魄力进行这一挑战。

  作为云知声的芯片品牌,“雨燕”是UniOne芯片矩阵中的初代产品,它围绕智能家居和智能音箱等场景,集成IoT人机交互的各项技术。云知声在发布这款芯片时称赞其能以1/10的价格挑战50倍的性能。李霄寒介绍称,第一代AI芯片雨燕的架构非常典型,云知声为此做了两件事情:一是专门设计具备自主知识产权的高性能DSP用于音频数据处理;二是为音频人工智能数据/神经处理器提供解决方案。当这一处理器被集成进去后,效果显而易见,相对于通用方案提升了50倍。在硬件设备方面,由于芯片高度集成,使得外围线路的成本降低了三分之一。

  黄伟表示,云知声在芯片上下足了功夫,为B端客户提供了一套完整的解决方案。其不仅利用人工智能引擎对“雨燕”进行调优,还专门为硬件产品设计app。客户即买即用,无需再找其他供应商,这是云知声今后芯片的销售服务模式。去年9月,云知声推出了基于“雨燕”的解决方案并进行开源,正式推出针对智能家居和智能音箱场景下的解决方案。截至目前,基于“雨燕”的全栈解决方案已导入的各类方案商及合作伙伴已超过10家,包括美的、奥克斯、海信、京东、360、中国平安、硬蛋科技等,相关产品有望在今年第一季度上市。

  黄伟透露,云知声2018年全年数亿元的营收较上年增长了3倍,几乎全部得益于芯片的功劳和正确的商业化路径。预计在2019年营收再翻2-3倍。而看似几个亿的营业额背后,实则撬动了几十亿甚至上百个亿的产值。

  在2012年公司成立后,同年9月云知声就推出了语音识别功能,专门面向端云互动。经过6年多发展,云知声已经拥有面向物联网单日用量达到5亿次的云平台,并为平台开发了ADPC模式作为AI深度处理的核心。2014年初,团队将语音识别技术分别切入到“AI生活”和“AI服务”两个场景中。很快,算法平台化的雏形初现。创始团队意识到仅有能力是不够的,“算力和算法的融合”以及“技术与场景的结合”同样重要。于是云知声便有了“云端芯一体化”的产品技术架构。当云、端、芯被认作物联网产品端的三要素时,云知声立即展开对IDM产品的开发,并于2015年正式量产,出货量呈规模性增长。与此同时,2015年云知声面临来自业务端的挑战:一是数据处理的挑战;二是成本问题。为应对这些问题,云知声认为基于深度学习的新硬件即“边缘侧的人工智能芯片”势在必行。去年5月16日云知声将第一代AI芯片雨燕(Swift)公之于众。目前云知声正开发的3款芯片将在年内投产上市:一款是面向语音场景的第二代AI芯片雨燕(Swift)-Lite;另一款是面向智慧城市场景的多模态AI芯片海豚(Dolphin);第三款是与亿咖通科技合作的车载多模态AI芯片雪豹(Leopard)。李霄寒解释称云知声已经完全具备硬件平台能力和分布式机器学习能力以及数据高速处理和迭代能力以满足物联网场景下芯片设计的需要。目前云知声的DeepNet 2.0已在FPGA上得到验证其算力将在AI芯片海豚Leopard上得以体现相较1.0版本DeepNet 2.0首先是兼容性更好可支持LSTM、CNN、RNN、TDN等网络;其次是支持可重构计算DeepNet 2.0计算单元可以拼接应对计算模式模式切换也可以快速组合用单条指令来计算公式;第三是支持Winograd将乘法耗时降低为原来的1/2进一步提升效率。此外李霄寒还介绍了AI芯片在算法应用方面取得的新进展——“超听限同向降噪技术”。所谓“超听限”顾名思义就是让机器识别到人类听觉范围以外的声音而“同相降噪”可满足在嘈杂的远场环境下保证芯片灵敏精准地捕捉人声。展望未来物联网AI芯片的发展路径云知声团队一致认为连接方式、安全性、PPA(PowerPerformanceArea)是核心但仅考虑这三要素还不够场景化、多模态、端云互动这三大方面将深刻地影响AI芯片的设计、定位、成本、功耗和芯片需求。

© 版权声明

相关文章