人工智能
直播中

彭丞峥

7年用户 159经验值
私信 关注
[问答]

AI语音识别市场规模怎么样?

语音语义识别是指通过语音信号处理和语义识别,使得计算机自动理解人类口述语言的技术。语音识别主要步骤为信号搜集、降噪、特征提取解码三步,提取的特征在后台由经过语音大数据训练得到的语音模型对其进行解码,最终把语音转化为文本。语义识别则通过自然语言分析,理解人类语言表达的意思。

回帖(3)

张波

2019-9-11 16:27:32
AI语音识别市场

3.1 市场规模
语音语义识别是指通过语音信号处理和语义识别,使得计算机自动理解人类口述语言的技术。语音识别主要步骤为信号搜集、降噪、特征提取解码三步,提取的特征在后台由经过语音大数据训练得到的语音模型对其进行解码,最终把语音转化为文本。语义识别则通过自然语言分析,理解人类语言表达的意思。

根据Research and Markets研究预测,全球智能语音市场将持续快速增长,到2020年市场规模将达到191.7亿美元。目前阶段,语音识别应用市场主要为智能音箱、智能语音交互家电等领域,可以预见,智能语音识别还将在自动驾驶、教育、医疗等领域得到深度应用。语音语义识别的终极发展目标为多语言自动翻译技术及设备,一旦该最终目标成为现实,将有可能彻底打破不同语言之间的交流障碍,重现“巴比伦之塔”,对人类社会产生极其深远的影响。
1、智能音箱市场
智能音箱领域正在迎来爆发式增长。目前,包括亚马逊、谷歌、阿里、小米、百度、京东、华为在内的全球互联网、手机巨头陆续进入智能音箱领域, 并将其提升到战略产品的高度。一方面,智能音箱作为智能家居的入口,有望带动其他硬件产品快速增长;另一方面,通过智能音箱作为家庭数据入口,各巨头有望在未来拓展其它商业模式。

2018年全球市场智能音箱出货量约为8620万台,同比增加170%,远超市场预期。2018年中国智能音箱累计出货量超过2000万台。2018年第四季度达到860万台,阿里巴巴、小米和百度等互联网巨头占据市场前列,市场份额分别为31%、29%和28%。
表2:主要智能语音音箱出货量及采用芯片方案统计(单位:万台)



资料来源:公司官网、智东西、九鼎投资整理
举报

刘美隆

2019-9-11 16:27:49
2、智能语音交互家电市场
除了迅速增长的智能音箱领域,各大家电厂商也都在积极集成语音交互功能。语音交互既能为产品增加一个新颖独特的功能,也能成为家庭语音入口并持续积累用户行为信息。

1)智能电视市场
随着以小米电视为代表的智能电视逐步普及,看电视的方式在过去三年间发生了巨大的变化,年轻一代的电视观众迅速完成了从被动收看直播到主动点播甚至搜索内容的模式转变。语音交互为智能电视的内容搜索功能带来了极大的便利,将有力地带动高质量付费内容的收入增长。目前,创维、小米、暴风、海尔等均已推出智能语音识别电视。

2017年,中国智能电视销量达4736.5万台,同比增长13.8%,2018年智能电视销量将突破5000万台。预计语音交互将迅速成为智能电视的标准配置,成为语音交互技术的另一个巨大市场。

2)智能语音空调
2017年,全国空调内销量8875.5万台,同比增长46.8%。近几年,空调每年内销量保持在6000万台以上,美的、格力、海尔、奥克斯、长虹均已推出语音智能空调,具有智能语音交互功能的空调市场空间巨大。

3)其它语音交互市场
2018年以来,具备语音识别功能的儿童故事机(机器人)、自动晾衣架等产品的出货量及增速均超过预期,带来大量的智能语音识别芯片需求。根据最新的市场调研粗略估计,全国自动晾衣架年出货量超过3000万件,儿童故事机(机器人)年出货量也有望达到4000万台。预计语音识别功能的渗透率将在未来3年超过50%。

3.2 发展态势
1、终端语音识别芯片集成AI模块趋势明确,但是在集成方式、功能定位方面存在不同策略。

目前,运用于终端语音识别的AI芯片分为通用型、半通用型和专用型。通用型AI芯片类似CPU,AI算法直接在主控芯片的计算单元中加速,可以保证该芯片能适应不同应用场景需要,灵活性较强,但成本和功耗相对较高,例如应用于天猫智能音箱的联发科芯片。半通用型AI芯片采用异构设计,常为CPU+NN模块的方式,NN模块专门加速AI算法,CPU作为补充,意图在灵活性及成本、功耗取得折中,例如应用在小米小爱同学智能音箱的晶晨芯片。专用型芯片是针对语音识别设计的AISC芯片,实现更低的成本及功耗,灵活性稍弱。由于语音识别应用逐渐成熟,市场需求逐步明确,针对特定场景的高效率、低功耗专用型AI芯片将成为主流产品。

此外,目前上市的语音终端产品中,针对不同的应用市场,部署的AI算法复杂程度各有不同。有的仅实现离线状态下关键词唤醒,如智能音箱;有的则实现了关键词识别、离线对话等轻量级的语音语义识别,如智能家电;有的需要在离线状态下依然支持全功能的语音语义识别,如车载场景。可以推断,由于AI算法尤其是训练算法的复杂性及不断演进,语音及语音识别仍将以云端运算为主。但同时,随着语音算法的进化和终端芯片的迭代升级,终端AI语音芯片将部署更多的AI算法加速模块,以实现更快的响应速度,满足车载等多元化的场景需求,与云端训练和推理互补,提升用户体验。

2、传统专业芯片设计公司的加入,加快了语音识别芯片的落地和量产。
国内杭州国芯、启英泰伦等AI芯片公司率先量产语音识别终端AI芯片,各音视频SOC芯片巨头公司联发科、瑞芯微、全志、晶晨也逐步推出类似产品。专业芯片设计公司与算法公司合作,凭借自身成熟的芯片设计、产品定义和成本控制能力,推出了低成本、低功耗、可离线唤醒和语音识别功能的AI芯片,应用于在智能音箱、智能家电等终端产品中,预计2019年出货量将达到千万级,未来3-5年将保持快速增长。
举报

张敏

2019-9-11 16:27:52
3、算法公司开始延伸至芯片设计环节,形成算法和芯片公司既互补又竞争的格局。
国内语音识别算法公司中,科大讯飞占据主导地位,同时有云知声、出门问问、思必驰、ROKID、依图科技等知名的初创AI公司,形成一超多强的局面。各家在算法总体水平上相对接近,各有擅长的细分领域。为了更好的将算法方案落地并通过规模化降低成本,部分语音算法公司开始自研AI芯片,推出能够加速自有算法的AI专用型芯片,帮助其更快的在特定应用领域形成落地应用。部分算法公司通过合资设立芯片公司、与传统芯片公司合作开发等多种方式进入AI芯片领域。算法及方案公司开发芯片,可以更加准确的把握其自身的功能需求,但其在产品定义、成本控制、研发周期、供应链管理等多个环节的竞争力还有待时间检验。

(1)科大讯飞
科大讯飞是国内语音识别领域唯一的上市公司,拥有全链路的语音识别技术,建立了开放的云平台,利用AI算法技术和平台级业务,将语音能力授权给第三方。目前,业务已从***、教育领域拓展至医疗、车载和消费电子等领域。在医疗领域,科大讯飞与商汤合作,推出图像诊断加自动问诊人工智能医疗平台;在车载领域,全力推动前装市场,替换传统巨头Nuance的市场份额;在智能音箱领域,与京东设立合资公司叮咚,但2018年合作终止,叮咚音箱成为京东子公司。科大讯飞内部有一支专门研发AI芯片的团队,取得了阶段性成果。

(2)思必驰
思必驰从教育领域语音识别起家,拥有很强的本地语音识别技术。目前正全力进入车载、家居语音行业。在智能音箱领域,为国内一半以上产品提供语音识别算法和方案,合作方包括小米小爱、天猫精灵、华为和网易等;在家居方面,2019年开始推广早教故事机等消费电子。2018年,思必驰联合中芯国际成立的合资公司深聪智能推出语音终端AI芯片,将思必驰的算法和芯片架构深度融合,推出低功耗终端AI语音芯片,目标市场为智能家居领域包括音箱、电视、白色家电等。

(3)云知声
云知声具有全链路语音识别技术,主要布局物联网语音识别,在家居和车载领域较为突出,客户覆盖格力、美的、长虹等,同时服务近100家车载语音识别方案和品牌商。目前,云知声业务拓展至医疗、司法等领域。云知声是最早成立芯片设计团队的AI语音算法公司,2018年量产首款AI芯片,2019年将量产第二代面向物联网领域的AI芯片,主要面向白色家电。

(4)出门问问
出门问问的策略是软硬件一体化,通过智能音箱以及智能手表和耳机等可穿戴设备切入,逐步扩展到车载和家居场景。与战略投资者谷歌深度合作,排名全球智能手表销售量前四;与战略投资者大众汽车深度合作,已经进入车载前端市场,推出语音输入导航、信息点搜索、即时通讯等功能的智能后视镜。与杭州国芯合作推出了“问芯”AI语音模组。

(5)ROKID
ROKID在2017年携手阿里推出全栈语音开放平台,为业界提供一站式语音解决方案和开发者平台,面向全行业开放语音识别、语音合成、语义理解、声纹识别、麦克风阵列、信号分析处理等多项技术。同时,ROKID也在2018年与杭州国芯合作推出自己的AI芯片KAMINO。

(6)其它
此外,由于语音识别在人工智能领域中较为成熟、落地最早,陆续有互联网和算法公司开始进入该领域。百度和搜狗主要以电脑和手机端的输入法为技术基础发展语音识别,在物联网终端需要的声音信号处理、多麦克风阵列的噪声控制、声源识别等算法上积累较少。依图科技作为计算机视觉识别领先企业,在2018年底发布了语音产品,在权威中文普通话数据集测试重表现较好。猎户星空作为自主研发语音交互、图像识别、视觉导航等全链条人工智能技术的初创公司,其搭建了数十名人员构成的芯片开发团队,与瑞芯微合作推出了语音识别AI芯片OS1000RK,目前用于喜马拉雅音箱。
表3:五大语音识别公司对比



资料来源:企业公开资料、九鼎投资整理
04  行业发展趋势

1、目前,AI语音芯片处于发展初期,多家成熟芯片设计公司、算法及方案公司和初创芯片公司正陆续推出AI语音芯片。
当前AI语音芯片企业可以大概划分为四类:一是互联网、通信类巨头的芯片设计团队;二是存在多年的成熟的芯片设计公司;三是新创立的AI芯片创业团队/公司;四是延伸做AI芯片的算法及方案公司。

其中,互联网和通信类巨头在算法和数据方面具有一定优势;成熟芯片设计公司在成本控制、芯片定义、供应链管理、客户渠道方面具有优势;初创芯片公司在芯片前沿架构和定制化方面具有优势;算法及方案公司在整合芯片下游算法和应用方案上具有优势。如果算法和应用方案持续快速演进,互联网巨头及算法公司将占据一定优势;在市场需求趋于稳定后,成熟的芯片设计公司将逐步获取优势。

2、中短期内,终端AI芯片受下游需求拉动,将快速发展。
第一,人工智能在很多场景已经实现了商业化运用,大部分场景均需要本地化的推断运算,因此终端AI芯片必不可少,且需求巨大。尤其在视频监控、智能家居、无人驾驶语音交互等领域,支持本地推断功能的终端AI芯片将是实现人工智能落地的关键要素。

第二,终端AI芯片根据具体应用场景深度定制,需求明确,芯片公司可以在设计架构层面进行算法实现的创新、压缩和优化,实现高效的轻量级人工智能,算法及芯片开发技术难度低于云端芯片。

3、近期,语音识别是终端AI芯片落地的重要领域,形成了算法和芯片公司既互补又竞争的格局。
由于传统芯片设计公司和算法及方案公司的共同发力,具备语音识别AI算法加速功能的终端AI芯片逐渐成熟,尤其是传统芯片公司的加入,推出了多款低成本、低功耗的AI语音芯片。虽然,目前各种语音识别终端AI芯片在集成方式、功能定位方面存在不同策略,但是在终端芯片集成AI语音识别功能的趋势已经很明确。能否更好的与云端互补,实现更强的AI算法加速能力,在性能、成本、功耗等多方面取得平衡,将考验终端AI芯片厂商的综合实力,也是未来行业内公司最关键的竞争力体现。

4、长期来看,云端ASIC AI芯片发展潜力巨大,是人工智能巨头的战略必争之地。
由于云端训练算法十分复杂,并且还处于持续发展过程中,短期内GPU/FPGA等灵活性较高的芯片依然将占据市场主流地位。待人工智能算法基本稳定,且规模化人工智能时代到来后,云端ASIC AI芯片才会迎来爆发式增长。

未来随着人工智能技术的不断发展成熟,数据的处理能力将成为最重要的生产要素,开发拥有强大训练和推理能力的云端AI芯片是各大人工智能企业的关键目标。因此,长期来看,云端ASIC形态的AI芯片将成为人工智能时代各巨头的战略必争之地。由于云端人工智能芯片与信息安全关系紧密,该领域也将成为各国***关注的焦点。
作者:孟伟、冯卓
举报

更多回帖

发帖
×
20
完善资料,
赚取积分