暂缓上市的云知声,技术究竟几何?

暂缓上市的云知声,技术究竟几何?
2021年02月25日 18:04 数据猿

大数据产业创新服务媒体

——聚焦数据 · 改变商业

在经过有关部门受理100+天后,有“AI语音第一股”之称的云知声终止科创板上市审核。此前,云知声2020年11月向科创板递交招股书,计划募资9.1亿元。

一度被业界认为是明星企业的云知声终止上市审核后,引发业界较多热议,毕竟是号称“AI语音第一股”,如果在科创板上市成功,将会是智能语音行业的一次里程碑式的进步,现在眼看上市在即,突然暂停,不仅对其自身发展不利,也加剧了外界猜测,一时间,公司运营存在巨额亏损、主营业务不断调整、收入过多依赖大客户、部分营收数据不明、市场占有率数据遭质疑、主管团队动荡不稳等声音此起彼伏。

云知声董事长兼CTO梁家恩

其实作为公司来讲,总会有这样那样的问题,金无足赤,即便上市不顺利,也不能否认其技术上的进步与突破,不能因为经营上的问题而掩盖了曾经的科技之光。

云之声成立于2012年,其在公司官网自称“是一家拥有完全自主知识产权、世界顶尖智能语音技术的人工智能企业”,以AI语音技术起家,一路走来,逐渐构筑起一个涵盖机器学习平台、AI芯片、语音语言、图像及知识图谱等技术的技术城池,成为具有“世界顶尖智能语音技术”的独角兽。

那么,抛开那些经营上的问题暂且不论,其智能语音技术究竟顶尖在何处,能让其有信心有底气昭告于外界呢?既然该公司身处人工智能领域,那就从人工智能的算法、算力和数据三个要素简单剖析复盘,似乎也比较符合云知声的扮演角色。

01

在算法方面,这个“顶尖”更侧重于在业界首先探索智能语音前沿算法

云知声是以一个破局者的身份出现的。成立伊始(2012年),云知声就在智能语音行业率先将深度神经网络(DNN)技术应用于商业语音识别系统,从这个角度说,比较符合“顶尖”的涵义,因为其不少同行以及其他大厂尚未进行如此创新,云知声成了“DNN商业应用的第一个吃螃蟹的人”。

深度神经网络也叫多层感知机,层数的多少直接决定其对现实的刻画能力,引入DNN算法能够有效提高识别率。一般而言,在语音识别中,4层网络就可以被视为“深度”。

正式引入DNN之前,云知声的语音识别引擎基于传统统计模型,准确率据说可达85%,甚至超过一些大科技巨头,不过仍然没有达到可以商用的水平。为此,云知声率先引入DNN,推动了语音识别引擎的可商用性,使其产品得到了市场的高度认可。如云知声在与搜狗的合作中,从双方首次接触到达成合作最终发布产品,只用了两周时间。2013年罗永浩“锤子ROM”发布会上,成立不足9个月的云知声就击败行业大佬,成为“锤子ROM”语音解决首选方案。

但随之而来的就是DNN也成为行业内外众多企业的选择。云知声的这个技术时间差为其带来了一定的发展空间,也开辟了行业之先,这种创新的探索值得鼓励,但可能因为赛道选择等原因,很快就陷入激烈的同质化竞争,而其他同行甚至大厂,因规模更大、资金更多等自身优势,市场表现甚至比云知声还要好很多。算法无国界,云知声能实现的算法,也难不住其他公司。

为使产品取得更大的市场份额,云知声继续深入进行前沿算法的商业实践,在卷积神经网络(CNN)、回归神经网络(RNN)、端到端序列建模、生成对抗网络(GAN)、注意力转换模型(Transformer)、双向编码表征转换模型(BERT)、知识蒸馏(KD)、自监督学习(SSL)等主流技术算法的引入上,都成为业界最早的实践者之一,这使得其产品能够不断提升技术性能,获得客户认可的效率较高,进入不同场景的速度也高于其他同行。

当然,至于云知声产品的市场占有率不如其他同行,原因很多,但就其技术及应用来说,云知声的产品依赖于其高超的算法,是有过不俗表现的。比如云知声2016年就已在协和医院推广应用了语音识别技术导诊系统、语音识别技术电子病历系统,且云知声语音识别系统的识别率据说已高达95%以上。相比之下,其他行业大佬与协和医院的合作要晚一些,识别率准确度也值得商榷。

只是,尽管云知声能够对智能语音算法做到率先掌握和商业化应用,能够为云知声跑在对手前面赢得一个时间差,但这不代表其他同行不会做、超不过,云知声的对手实力也不弱。如果云知声能够在这个时间差内迅速找准赛道、打开产品市场、建立属于自己的护城河,不仅能够一跃成为行业头部企业,而且整个研发销售、上市融资等公司运营就可以有条不紊大步前进了。

但从现实来看,相对于其他同行,云知声可能赢在算法的率先实践上,但在公司战略选择、实际市场运营上还存在比较大的问题,甚至对其产品的研发和扩大影响都形成了比较大的制约。精于技术、疏于运营,这似乎是大多数初创科技公司都会遇到的问题。

酒香也怕巷子深,云知声也认识到了这点,再先进的算法,也需要得到市场的认可,因此这两年加大了销售的费用,而这也被人责备为放松了研发。

其实对一个企业而言,资金盘就那么大,往销售倾斜的多了,必然在研发等其他方面的投入就会减少。这也是云知声不得已而为之的办法,企业要发展壮大,就需要更大的市场来认可自己的技术和产品。对云知声来说,在产品技术算法具备一定领先优势的情况下,适当增加销售支出,盘活市场、回笼资金,然后把盈利继续投入研发,似乎也是合情合理的做法。

02

在算力方面,这个“顶尖”更侧重于其对智能语音自研芯片的行业自觉

与同行、以及国内一些大厂相比,云知声对自研芯片重要性的认知不仅不落人后,而且其行业自觉更为强烈、造芯实践更为主动。

云知声在创立初期就认为必须要有自己的芯片,其创始人兼CEO黄伟曾表示,“无论是CPU还是GPU、FPGA,现有的芯片架构并非为AI专门设计,不能满足物联网AI算力需求,且考虑了太多的向后兼容性,因此在性能上远非最优”,对此他强调,“(智能语音行业)不造芯片就是死路一条”。云知声不仅是这样认识的,而且立即将造芯付诸行动,而不是空谈。相比其他一些同行长期依赖从外厂、外国购买芯片,确实顶尖。

云知声创始人兼CEO黄伟

云知声注重自主研发芯片,不仅来自于其行业自觉,也是环境使然。客观来说,在物联网的不同应用场景下,海量终端设备要实现功能智能化必须端云配合,即形成边缘算力和云端算力的动态平衡,而这就需要AI芯片的强有力支持,这也深刻影响到芯片的设计,以及最终的交付。在以5G驱动的万物智联场景下,芯片所触及到的数据维度将更加多元化,芯片所需处理的数据也由单模态变成多模态,这对芯片尤其是物联网人工智能芯片提出了新的要求,必须注重独立自主研发,形成自己的核心产品,靠外部购买永远也形成不了核心竞争力。

虽然云知声成立至今也才8年,但其造芯历史已有5年,在芯片的研发制造上,比一些同行甚至互联网大厂更具有行业自觉性和技术自主性。

云知声2015年启动造芯计划,并于2018年5月推出了首款AI语音芯片“雨燕”,成为行业内首家宣布造芯并成功量产的AI语音公司。据悉,“雨燕”主要用于生活场景下的白色家电、智能音箱及中控,工作状态下功耗小于800mW,延迟低于300ms。

在第一代UniOne芯片雨燕的发布会上,云知声介绍,UniOne并不是一颗芯片,而是一系列芯片,代表了云知声对于物联网AI芯片发展战略的整体构想。在UniOne中,云知声提供了自主研发的面向深度神经网络的AI扩展指令集,通过将多种复杂的AI计算抽象成算子,并在异构架构的硬件中实现。

2019年,在资金储备和市场拓展都面临较大压力下,云知声仍然进一步扩大芯片产品可适配的物联网设备范围,陆续推出车规级芯片“雪豹”和面向家居领域的第二款升级版芯片“蜂鸟”系列,启动具备“图像+语音”多模态交互功能的芯片“海豚”的研发。截止目前,“雨燕”、“蜂鸟”系列均已量产,既直接对外销售,也自用于部分公司模组和整机类产品,而“雪豹”已进入产品稳定性测试及车规阶段,预计在不久的将来也能够实现量产。

为了不断厚实自研芯片的技术水准,在图像与芯片技术的产学研合作方面,云知声还与杜克大学所领导的美国自然科学基金旗下唯一人工智能计算中心——ASIC达成深度合作,致力于AI芯片算法压缩与量化技术,以及非冯新型AI芯片计算架构研究,进一步为云知声多模态AI芯片战略的推进夯实基础。

为了这小小的商业芯片,云知声几乎把所有的“宝”都压上了,研发费用一度几乎是其全年的营收,当然效果也很明显,云知声处理器速度比同行速度快,且成本低,得到了众多客户的认可。

尽管一些人质疑云知声的芯片仅为最普通的40nm工艺,但这似乎也比过于依靠购买芯片进行生产经营的其他同行更为独立自主些,对整个智能语音行业的发展来说也是一个有益探索和不小的贡献。因为靠买是买不来现代化,更买不来尊严的,被人“卡脖子”的感觉,相信一些大厂更有切身的感受,而云知声以一个成立不足十年的独角兽身份,已经在芯片领域不断探索五年,这种独立自主的科研精神也算得上是一种“顶尖”。

但芯片行业是一个高投入、高风险、慢回报的行业,芯片研发周期非常长,从立项到上市,即使最快也通常需要两年左右的时间,一些大厂甚至都是在成立很多年、被人“卡脖子”之后才奋发造芯。作为创业企业,特别是从事算法的小独角兽,如果自己独立研发芯片,在时间和资金方面都会面临巨大压力,这还不算那些外部的同行竞争与市场挤压,其中最主要的因素是芯片成本高,对错误零容忍。如果已经流片,纠正一个错误可能还需要额外的半年左右时间以及预算,外加几百万美元,用于再次流片。

面对巨大的芯片研发资金需求和行业内外压力,也就不难理解云知声为何要谋划上市融资了,这也是云知声实现破局的最佳途径。

当然,随着制度的不断正规严格,确实也可以防范一些企图上市“割韭菜”,或许会遭“误杀”,但确实也可以防微杜渐。

云知声在其官网称,“云知声汇集了一群有梦想和共同愿景的人,相信科技改变世界,人工智能会让未来生活更好”。现在看来,他们是这样做的,在内外交困的环境中,坚持芯片研发不动摇、不松懈、不放弃,其芯片情怀也可堪称“顶尖”。

03

在数据方面,这个“顶尖”更侧重于在智能语音领域“全栈”布局

成立初期,云知声只提供类似于智能语音会议系统、智能语音客服等通用的单一语音工具,虽然具有一定的技术优势,但在竞争激烈的智能语音赛道上与其他同行并无根本上的区分度,导致这些智能音箱、教育机器人等消费电子产品市场逐渐成为同行大佬和其他互联网大厂的聚焦之地,竞争激烈,再加上云知声作为初创公司,客观上确实难以形成坚固技术壁垒和有效的竞争优势。

因此,云知声寻求市场突围,逐渐将经营策略由2C转为2B,将单一产品升级为综合解决方案,面向酒店、社区等场景规模交付。而这个赛道调整,客观上使云知声又一次走在了智能语音行业前列,扮演了探路者角色。

为解决更多场景带来的语音数据问题,云知声在2014年率先提出“云-端-芯”的“全栈”布局产品战略。该战略的作用是对众多语音核心技术的模块化梳理和整合,能够面对市场多样化场景需求,拥有快速产品化的能力。其中,“云”主要解决终端智能化问题,“端”主要解决AI应用场景化问题,“芯片”可加速AI应用的落地。

按照云知声的智能语音技术设计规划,当边缘侧芯片无法处理更复杂的语音数据问题时,就需要借助云端高性能计算服务器来完成,而云知声自主搭建的智慧云平台,以公有云的形式或者根据客户特定需求进行私有化部署,搭载各项核心技术引擎,解析用户语音数据需求,能够将用户数据需求与云端服务对接,使缘侧芯片以更低的成本和功耗提供硬件算力需求,加之配套软件能够为不同类别的终端设备做适配,从而形成相对标准化的语音数据解决方案。

云知声的招股说明书也显示,云知声依托“云-端-芯”产品中台,形成了智能语音交互产品、智慧物联网解决方案、人工智能技术服务三条业务线,以及数十个产品类型的矩阵式产品结构。其中智慧物联网解决方案就是云知声在场景落地方面的升级,并且从此次招股说明书中拟募集资金的用途方面也可以看出,这也将是云知声未来的重点建设内容,似乎云知声想以此真正建立行业“护城河”,使云知声在激烈的市场竞争中谋得一席之地,有效地生存和发展。

总的来看,云知声想达到这样一种效果:提供跨硬件平台、跨应用场景、云端芯一体的物联网语音交互产品和面向行业级客户、覆盖“感知”、“认知”、“决策”等不同层次的智能语音工具产品;在智慧物联解决方案领域,主要面向酒店、社区、住宅、医院等特定场景提供智慧物联综合解决方案,助力众多企业级客户实现用户与设备、设备与设备之间的互联互通互动;面向优质龙头客户提供人工智能技术服务,赋能众多客户开展业务智能化升级、降本增效、提高生产力。一言以蔽之,就是通过其智能语音技术,让更多的客户、更广泛地“智享未来”,这是云知声对外宣称的行业愿景与技术初心。

从算法到算力、数据,云知声一路探索而来,至申请上市之前,云知声已完成8轮融资,公司估值约80亿元,这也使其成为首次上市前最后一轮融资时业界估值最高的语音AI独角兽,可以说是其“顶尖”的智能语音技术给其带来的最显著成果。

从数据显示来看,正是云知声在技术研发上不断投入巨额资金,才确保了核心技术自主可控,构建了自下而上的“全栈”人工智能技术体系,自主搭建Atlas超算平台,将机器学习等前沿技术广泛应用于信号降噪增强、语音识别、声纹识别、语音合成等技术开发,甚至一度成为行业风向标。虽然有人指责其“研发费用多、发明专利少”,但似乎至今无人指责其在智能语音行业里的开创性举措。

云知声此次上市计划募资规模约9.12亿元,其中3.01亿元用于人工智能技术中台建设项目,3.17亿元用于面向物联网边缘计算的人工智能芯片研发平台建设项目,1.44亿元用于基于人工智能技术的智慧医院解决方案建设项目,1.50亿元用于补充流动资金。从这可以看出,云知声的融资重点还是在其“全栈”战略的研发与实践上,如果云知声未来还有机会上市成功,相信其在智能语音领域的“全栈”布局会更深、技术会更顶尖,届时才真有可能从上游到下游真正建立属于云知声的智能语音行业壁垒。

未来云知声何时再次上市尚不得知,但其以往对行业的助推促进不能忽视。若论实力,云知声可能不如那些成立时间更早、上市时间更长的行业大佬,但在一些语音识别的关键指标上,如lvcsr的wer,云知声的技术是不弱的。而且目前云知声在商业化落地方面,已覆盖了家居、车载、机器人、医疗、教育、政务等众多领域。不同于其他同行在行业内的“分蛋糕”,云知声目前正在这些蓝海中“做蛋糕”,靠的也正是其“顶尖”的技术追求吧。

只是,光有智能语音技术和应用上的规划探索还不够,要想在智能语音行业实现从技术到规模的真正顶尖,还需要源源不断的资金融入,以及良好的公司运营、精准的赛道切入,而这也正是目前云知声的短板,似乎这也是很多初创企业面临的共同问题。

同时也要看到,阿里、百度、小米等大厂也在智能语音行业进行渗透和布局,科大讯飞、思必驰等同行的软硬件竞争实力也不弱,有的还占有很大的市场规模优势。客观而言,上市暂缓的云知声当前和今后面临的行业竞争、生存环境会更加激烈、严峻,特别是其亏损持续与融资困难会更为严峻地考验其技术能力和市场参与。

对于暂缓上市,云知声称“把业务做好”,这个业务不光是智能语音技术强的业务,更包括产品赛道的选择和公司运营的优化,所以不管这是不是云知声针对暂缓上市的解释,确实是云知声的当务之急。虽然面临的困境会大一些、问题会多一些,但是古往今来、数智内外,时刻都在大浪淘沙,最后能赢的,也许就是那些坚持不懈、咬定青山不放松的。

文:赵长春 / 数据猿

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部