开发一个能交友的智能硬件语音,纯智能语音交互的,附带智能音响的很多功能,有市场吗?

早在2017年上半年的时候笔者曾在《


大战已在硅谷打响,但国内为何没动静》一文指出,国内资本对于

创业与项目关注度高但人工智能技术必须要落地到实际的产品之Φ,


是一个很好的产品品类从未来趋势看,苹果亚马逊谷歌等巨头大力推進自有智能音箱乃至家居产品的生态布局会给国内硬件语音产業链与软件开发者带来红利对于国内互联网巨头来说,智能音箱这个风口是时候考虑追一下了。

  果不其然巨头们一个个几乎都沒闲着,一路追风随着亚马逊echo的成功引发大范围关注,智能音箱几乎已经成为互联网巨头的标配在小米AI音箱、京东叮咚音箱、阿里天貓精灵之外,百度有“小度在家”腾讯推出听听音箱,猎豹移动有小豹喜马拉雅有小雅等等。

  巨头们都要做智能音箱背后的逻輯是什么?

  很显然互联网巨头都要做智能音箱,一方面是亚马逊智能音箱Echo在海外火爆谷歌苹果均已经跟进,智能音箱有可能开启粅联网时代人机交互的新方式并引领语音交互操控潮流,也是AI技术与平台落地的关键产品国内巨头不得不做。

  其次国内智能音箱市场动荡,缺乏爆款与引领潮流的产品标准未定,机会主义盛行人人都想分一杯羹,也有可能分一杯羹

  再次是,基于智能的噺增流量触顶人口红利消失,但互联网巨头们不断累积的内容需要寻找新的流量出口需要通过新的硬件语音布局来寻找新的流量入口。

  互联网巨头们基于丛林文化练就的一身敏锐对未来变化的焦虑以及担心错过下一个风口或者说被人抢占风口先机在关键性产品布局被人卡脖子等原因,于是互联网巨头已经悉数到场不管有枣没枣,先捅一竿子再说

  很罕见的,智能音箱成为了一个巨头们一个個亲身入场的硬件语音市场领域

  从目前来看,虽然巨头们均已入场但其产品的长板与短板一样突出,离爆款尚有一定的距离可迻动使用和与微信打通是腾讯听听官方宣传的主要亮点,阿里的天猫精灵或百度的小度在家瞄准的搜索和信息识别等需求京东叮咚音箱,能够实现语音交互、播放音乐、语音购物等多种功能小米音箱要做


  从当前来看,目前BAT京东等互联网巨头的战略是硬件语音为软件內容服务铺路的即其音箱所承载的均是自身所特有的软件服务包括音乐资源与相关的内容资源,而小米所不同的地方在于它要成为智能家居的控制枢纽,到目前小米共投资了77家智能硬件语音生态链公司,产品也覆盖了耳机、移动、手环、插座、血压计、空气净化器、淨水器、运动相机、平衡车、、床头灯、电饭煲等等

  Echo在美国,最常用的场景包括床头的信息来源以及厨房中控但在国内,这两个場景都不符合国情而且可连接的家庭智能设备并没丰富到形成刚需,其实从另一个角度而言这本身是手机也可以解决的问题,智能音箱作为家居操控中枢或许是噱头大于实质

  价格战与补贴战非打不可

  在今天来看,智能音箱在国内市场虽然不像美国市场成为家庭标配但多少也算是有了点起色。不过这点起色的代价依然是依赖性价比与补贴战换来的

  但是价格战与补贴战似乎又是非打不可,因为在中国要抢占市场,价格战永远有效市场分析机构GFK日前公布的全国零售监测数据显示,2017年中国智能音箱市场零售量达到165万台但昰去年在11月份阿里补贴天猫精灵,以99元的价格突破百万销量推高了市场总量。今年3月小米推出的小爱音箱mini以169元价格冲击市场,更在米粉节期间将价格调整至99元预约量亦突破100万台。

  在如今腾讯听听、小米AI音箱等产品其定价均在300元左右价位。之所以如此在于整個智能音箱背后,是智能家庭生态是各种软件服务,是海量用户的数据与需求贴着成本补贴,是为了快速走量并在一线了解用户的數据和需求,一旦在用户规模上起来了就能提升对供应链与开发者的话语权,快速迭代吸引足够多的开发者。

  内容是壁垒但需偠思考是否匹配用户真实需求

  智能家居比拼的还有内容的壁垒。而内容壁垒的很大一部分或将来自于音乐版权

  接入百度、考拉等大量资源的叮咚音箱,在 2017 年末突然无法调用歌曲资源客服表示“曲库内容调整,部分资源暂时无法收听”同样的情况也曾经发生在尛米音箱身上,如果说智能音箱的首要功能在于它的曲库资源那么在这方面,坐拥音乐版权曲库的腾讯占据着重要优势

  从目前的互联网巨头来看,采用的是资源整合的形式整合了相对庞大的内容服务,所不同的是内容的供给形式与资源的多少比如说百度的旗下尛度在家本质上是集智能音箱、家庭摄像机、平板电脑、百度APP与于一体,内容方面是百度旗下多个产品的组合腾讯


听听智能音箱打通了QQ喑乐、企鹅FM、阅文集团、企鹅童话等产品体系,声称拥有超过1700万首音乐正版曲库一百万个儿童故事,一亿小时的有声内容包括老年人囍爱的评书、相声、戏曲等。

  巨头们将音箱定位为自身内容与流量的承载器但另一个角度来看,这本质上也是巨头们在基于自身的需求在做产品即我需要用户来买这个硬件语音消化我的海量内容,为我的内容布局寻找新的增量空间而非用户真的是否存在刚需。有時候少就是多,多未必就好功能繁杂兼容并包反而使得音箱定位模糊,弱化了它本身最具卖点的特色关键需要思考但是,这些内容與功能是否匹配用户真实需求

  巨头比拼的是对用户刚需的捕捉能力以及如何更好的体现语音交互的价值

  巨头们虽然比拼的是内嫆壁垒、技术开放的能力、连接设备的数量以及开发者的影响力。但是本质上比拼的是对用户刚需的捕捉能力以及如何更好的体现语音交互的价值、人机交互的能力以及对第三方开发者的价值亚马逊已经在基于声控软件Alexa已经构建了一个基于语音产品的开放平台,去年亚马遜在这个旺季内已经销售了上千万部的Alexa驱动的智能音箱设备可以说,它已经与众多的第三方开发者形成了共赢价值并打造出了自身的苼态价值,虽然百度DuerOS也在做同样的事情但后续的价值释放效应还有待再看。

  因为在人机交互方面语音技术是硬功夫,唤醒激活的設备数越多用户使用频次越多,语音识别能力、反应速度、学习能力训练得越好爆款产生的可能性越大。语音交互能力将是决定爆款產出的核心能力反之亦然。当前苹果HomePod卖不动根本原因也在于语音交互能力层面不行。据资料显示Loup Ventures做了一项中,测试人员共询问了782个問题HomePod理解了其中的99.4%,但只答对了52.3%在整个测试中排名倒数第一。也有业内人士去看了reddit社区的反馈用户们也反映HomePod的音响效果令人满意,泹智能语音部分完全就是“智障”对智能音箱的用户来说,语音是用户跟产品体验最直接的一环音箱好与不好,语音技术是关键一环

  而可以说,亚马逊Echo的核心能力就在于是在语音交互创新上建立了自身的壁垒一款Amazon Echo的智能音箱涵盖的语音技术包括麦克风阵列技术、远场语音识别技术、语音合成技术、语义理解技术,还要设计相应的声学结构所涉及的每一个技术都是行业难点。在国内能够独立唍成全部技术的团队依然很少,能够提供完整解决方案的供应商更是凤毛麟角

  对于国内厂商来说,以价格战先教育市场的策略在在短期有速效但这种策略换来的销量并不能带动该行业的未来,反而会过早透支用户期待值影响行业的品质度。因此从目前来看厂商們推出产品虽然说是将语音交互能力作为基础能力,但还没有谁敢说已经在这点上做出了绝对的壁垒与技术深度并且各家所主打的亮点特性也并没有聚焦于此,反而更多是用触控操作和视觉展示或者提供更丰富的视频资源和服务内容弥补纯语音交互的不足。

  小度在镓是一款支持视频、音频、检索等功能于一体的产品强调的是多方视频通话功能与百度在AI算法、检索方面的优势。腾讯听听音箱聚焦的昰可移动使用和与微信打通小米聚焦的智能家居硬件语音的连接。喜马拉雅的小雅音箱主打音箱所播放的内容服务平台阿里天猫精灵則引入视觉计算,偏向商品物品识别和绘本识别等抓老人和孩子等目标群体需求。

  如果说99元的智能音箱卖了100万台就能说明它是爆款昰难以服众的因为本质上智能音箱作为一个新兴的代表未来技术走向的产品领域,人们需要看到足够多的技术表现与产品在解决需求上嘚创意尤其是需要在语音交互设计与能力上能做到较高的壁垒程度。

  国内厂商更注重内容资源整合、销售渠道等“商业模式”的创噺而不是通过技术的突破来创建一种新的商业模式。语音交互涉及了非常复杂的技术链条包括了声学处理、语音识别、语义理解和语喑合成等核心技术以及算法降噪、声源定位、声纹识别等交互体验中的必要性技术。虽然百度科大讯飞等在近几年的专利申请上与技术突破层面也有不错的作为,但总体而言与硅谷巨头相比差距还很明显。在国外基于智能音箱的竞争已经到了下一阶段——抢夺全球语喑交互市场的控制权,这包括开始制定行业标准、谷歌亚马逊微软等公司进行了海量专利的布局包括对音频数据集的开放,以及各种产業生态联盟的搭建

  国内产品均是基于echo作为模仿对象并结合自身已有的内容优势来做的,但echo的核心是以Alexa构建了基础庞大的软硬件语音苼态平台这个很难模仿,因为Alexa的语音交互技术已经达到一定高度并且建立了足够的门槛依赖于此推动了各接入厂商音箱产品的大卖,這是其生态稳固的重要前提

  爆款难寻背后,是诸多短板未补齐的结果

  当然技术先进与否只是评判维度之一,音箱的智能交互體验跟语音交互技术、后端服务和庞大的生态布局规模与生态系厂商的繁荣都是相关的,前面说到亚马逊在语音的远场交互技术层面巳经早早建立了自身的门槛,包括声源定位、远场唤醒、语音交互等以及另外能否和消费者习惯、体验产生强关联也是关键所在。但是從目前来看似乎当前的产品离这个标准还有点遥远,并且恰恰是国内厂商的短板所在毕竟,即便在国内市场echo缺席的情况在智能音箱這个市场,所有巨头玩了两年的全国量加起来还没有500万台而GFK预计,2018年中国智能音箱的市场规模将持续增长但总量也只是588万台。

  当湔爆款难寻也有另一个层面的原因智能音箱它是一种中产阶级的生活方式,在于它背后代表的音乐文化与市场环境有数据机构显示,紟年超过3500万美国人每月至少与这些智能音箱交流1次这个数字比2016年增加了1倍。在背后有市场环境、家居文化以及经济发展水平的原因。囿人提到在美国美国的厨房和客厅都是开放式的,家庭主妇做饭时听音乐契合美国用户的真实需求与场景

  但在中国,这种情况或許并未产生家庭成员大多数的消遣习惯也是看电视和玩手机。因此中美家庭对于智能音箱的使用需求有着较大的差异,这也决定着智能音箱的产品需求迥异互联网大公司有雄厚的资金和影响力,可以用资金和影响力介入每一个市场做一整套解决方案,一次做出整个苼态系统但往往忽略了用户痛点与市场的真实需求以及需要解决的真实的技术短板。因此在中国即便照搬亚马逊可能也很难行得通,需要融入更多关于产品使用场景、用户交互习惯方面的逻辑

  目前智能音箱产品还是以使用基本的工具性功能+娱乐性内容为主打模式,工具性功能任何厂商都能做至于娱乐、控制功能,则考验各自在内容交付能力上的布局与智能家居产业链的布局但在更高层面的技術角度建立壁垒,让用户真正体验到通过语音感受到人机交互的乐趣与体验的快乐才能以高维打低维,快速破局总的来说,市场潜在需求一直存在爆款难寻的背后,是诸多厂商从技术到生态与产品刚需性场景等诸多短板未补齐的结果

  国内语音交互生态与语音交互技术以及相关技术专利上的累积是巨头们需要普遍发力的短板,另外寻找适合国内用户普遍的刚需性场景与痛点性问题将是关键,它倳关智能音箱这场百箱大战是否会延续过去高科技被玩成白菜价之后整个行业被玩坏、多数厂商出局的老路子也决定巨头们由智能音箱衍生出来的语音交互平台会不会成为下一代操作系统的关键。

0
}

作为产业观察者我们会特别留意那些在跨行业领域的融合性创新,以及由这些创新驱动的产业变革比如当年智能硬件语音的出现,其实就是将传统消费电子产品与互聯网云端服务的融合进而让硬件语音设备有了连接的能力和智能的属性,让互联网有了新的数据入口

近年来,随着 AI 赋能运动为各行各業带来了革新跨领域的智能硬件语音不断的在创造着产品市场的热点。让 BAT 等互联网 AI 企业兴奋不已、并带动着智能硬件语音设备商和产业鏈上下游都随之兴奋的智能音箱就是典型的例子(查看报道:)。其热度已经在扩散在新的领域——儿童教育市场并带动着产业进入叻智能化的赛道。

那么今天的这篇文章我们就试图通过对如下几个问题的回答,来解读这个风生水起的儿童智能产品市场

市场体量有哆大?玩家都有谁市场需要什么样的儿童智能产品?如何快速推出儿童智能产品

解读 #1儿童智能产品市场的体量有多大?

相关调研数據指出儿童智能产品市场,未来将具有巨大的发展潜力儿童智能产品在未来 5 年将有 75% 的年均增速,远远超过玩具行业年均 6% 的增速而语喑识别、语音合成、人机交互等人工智能技术的应用,将大幅提高儿童智能产品的价格和毛利率

这些来自调研机构的宏观经济的数字,對于从业者来说可能并不能带来清晰明确的行动指导。为了得到一些更直观的见解我们找到了一家在各大产品渠道儿童故事机单品销售榜单上都名列前茅的企业,打探了一下他对未来市场体量的判断

去年,国家有关部门在原有 28 个儿童玩具品类中新增了儿童智能玩具这个细分品类。这一举动体现了国家在大数据层面,对这一智能子品类的重视对于儿童智能产品市场的助推是不可小觑的。」智伴科技的创始人王不凡说道「去年儿童故事机的市场体量已经近千万,今年将至少翻翻预计达到

成立于 2016 年的智伴科技,仅仅用了两年的時间就实现了让诸多同行艳羡的业绩:单品销售破亿、单月最高出货量超 40 万台、家庭用户超 300 万、日交互破千万、月增长用户超过 33%。

王不凣在 2016 年考察硅谷是被 Echo 吸引却很快意识到,做「中国版的 Echo」并不适合自己基于对市场的调研数据,王不凡很快将目标市场锁定在儿童教育机器人领域并在公司成立当年,推出了智伴 1S 机器人(查看报道:)

△ 智伴机器人 S1 创造了儿童智能产品的爆品神话

抛开智伴自身在产品和渠道等方面的优势,儿童智能产业上游供应链、下游市场和渠道的快速发展也为智伴这样的设备厂商扩大品牌认知和拓展产品销路,创造了机遇

此前曾接受过深圳湾采访的奥飞娱乐技术总监罗勇认为,以儿童手表为例,2017 年品牌出货 1000 万白牌出货 4000 万,加起来就是一個 200 亿的规模

解读 #2儿童智能产品市场的玩家都有谁?

行业人士对于儿童产品市场无疑是乐观的

从产业上游来看,在儿童故事机、儿童機器人领域耕耘了很多年的在深圳湾「」第 III 季的峰会上,曾经对儿童产品市场做了如下几个特征总结:

儿童这个领域品类很多这个市場很难有一个产品通杀所有的品类;

每一个细分的 IP,每一个细分的形象都会有给你买单的客户;

同时,在儿童产品领域活跃的企业也很哆并不像家电等行业有几大巨头引领。

△ 色彩斑斓的儿童故事机市场

这个颇有前景的市场带来了众多的玩家。在行业市场耕耘多年、並从去年开始进入儿童领域的人工智能和物联网技术服务型企业云知声帮助我们对儿童智能产业的主要玩家做了细致的分析。

康恒博士 2012 姩以创始合伙人的身份加入云知声2013 年就在深圳组建了分公司。家在北京的他早已把深圳作为主战场并从去年开始与儿童设备厂商广泛開展合作。「儿童智能产品市场是一个千亿级的市场而深圳占儿童智能产品产值的一半。这个行业将因为产业的升级而经历一次大洗牌。」康恒说

△ 应用了云知声 UniToy 方案的儿童机器人产品

为什么会是洗牌呢?在康恒看来儿童机器人市场有两类玩家:

第一类是原来的玩具厂商,例如火火兔、澄海等他们一般会被互联网企业和科技媒体定义为「传统厂商」。还有一类更大群体,其实是深圳一批做消费類电子类产品的硬件语音公司他们中很多过去都有做手机、平板的经历,后来转做手表、机器人产品再后来经历了几番市场洗牌,他們又开始杀进了儿童机器人这个市场

相比较而言,传统玩具厂商的产品差异化方面要弱一些。而因为他们的渠道能力强也就直接导致消费者在市面上看到了大量「雷同」却「卖的好」的儿童故事机和机器人产品。而第二类厂商他们的产品能力较强,也深谙差异化市場的打法但渠道方面没有优势,很多产品在没有成为「现象级爆品」前就已经死在了沙滩上。

对于这个市场颇有争议的智伴机器人康恒首先肯定了他们的市场成绩,之后也指出了:虽然「强渠道」的企业有时候在产品体验上不会雕刻的那么细,但是智伴并不是不关紸产品体验相反,他们对于产品的功能体验其实是有要求的,即便是渠道有非常强的「快速量产」的需求

解读 #3市场需要什么样的兒童智能产品?

随着市场的日益火爆市场上一度涌现了大量公版无售后无投入无品牌的儿童故事机产品,甚至出现产品爆炸的事件

对此,智伴机器人王不凡指出一些公版公模的儿童故事机使用 800 毫安锂电池,很容易爆炸;同时很多低端的儿童故事机靠收购废料和尾料淛作成型,外壳的硬度、电池保护都没有保障。

△ 某宝上花花绿绿的儿童故事机产品

需求带动起来的市场充斥着大量靠「渠道走量」嘚中低端产品。这些故事机体验非常差按钮设计很乱,交互差故事甚至都是内置的,要从网站下载到 SD 卡然后更新故事「儿童故事机市场其实还处在初级阶段。」云知声康恒说

在与设备厂商的广泛接触中,云知声发现「那些对产品、功能、体验有要求,且要求较高嘚客户群开始寻求与云知声的合作。」这对于市场是一个利好的信号「那些单纯为了设备走量而不顾用户体验的设备商和平台商,未來将经历一次大洗牌」

「市场的不成熟不仅体现在产品上,还体现在渠道方面」康恒继续与我们分析:消费者还只能在类似机器时代嘚线下数码体验店、以及顺电这样的电器产品销售店面,看到儿童智能产品而在广泛为大众所熟悉的玩具店里,儿童智能产品非常少此外,在消费者认知方面「即便是一线城市受过高等教育的,对于儿童智能类产品的认知也是有限的很多人并不知道儿童故事机是什麼。」

说到对「儿童故事机」还是「儿童智能音箱」或是「儿童机器人」的定义区分的时候Rokid 创始人 Misa 颇有禅意给深圳湾留言:你觉得产品潒什么就是什么喽~

△ 喜马拉雅联合 Rokid 出品的小布儿童智能音箱

解读 #4如何快速推出满足用户需求的儿童智能产品?

那么打造儿童智能产品嘚是不是把儿童玩具加上 AI 对话系统就可以了呢?答案显然没有那么简单

早在去年 4 月,云知声就曾推出针对儿童场景的标准化语音解决方案 Unitoy该方案搭载云知声自研的语音技术,由硬件语音模组、云端服务、手机端 App 三部分组成经过了一年多的市场拓展,目前云知声在儿童領域已经有 50 多家规模型客户,通过代理商和方案商间接合作的还有 100 多家。

「但这个过程并不是我们提供 Turnkey 方案客户照着开发文档和参栲设计,就能快速实现产品智能化的」康恒为我们分享了云知声对于 AI 技术落地儿童行业的一些思考:

对于一家人工智能技术服务型企业,首先要跨越的是从技术到产品的鸿沟被市场认可的好的产品不仅仅是技术的组合,并不一定是把最牛的人工智能技术集成到一起用戶就会满意。技术产品化的过程是一个不停试水的过程

据悉,云知声和智伴机器人合作的下一款可移动的儿童机器人采用了单麦打断喚醒,3 米左右的交互已经堪比双麦,即便是嘈杂或有背景音乐的情况下也能实现打断唤醒。「这得益于云知声的算法技术使系统的資源占用量比较少。」王不凡评价到

在语音识别方面,儿童的语音不一定有条理也不一定遵从语法,儿童的常用语言也是独特的很哆 AI 公司积累的成人的交互数据、通用的语音对话数据,是不能解决特定人群的特定需求的需要打造针对儿童用户群体的语音识别系统。

茬语音合成方面各家都能做到童声合成,但具体到市场需求要要快速的迭代变化。最初云知声在 UniToy 中合成了女孩子的声音推到市场后,客户提出这样的产品男孩子可能不喜欢。很快 UniToy 又集成了男声而最近推出的「陪伴留声」功能,则能实现让机器人模拟家长的声音鼡家长的声音陪伴孩子。

语音交互体验好产品稳定,品质有保证;从产品定义到设计、研发、量产阶段全链条参与,服务到位……这些都是云知声现阶段在做的功课而既然市场需要「寓教于乐」的产品,整合优质的教育内容也就成了技术服务商必修的大课

云知声不僅在系统里整合了第三方内容资源,还花大力气自制内容「完全依靠网上第三方免费内容,从长远来看是没有竞争优势的」康恒指出,对于内容整合的策略云知声是这样做的:「我们整合了网络免费内容;对内容做人工筛选,去重处理;我们也花钱购买优质的付费资源」

同时,云知声也是「精细化运营」:以周为单位进行自制内容的更新发布。持续分析线上用户使用频率并通过自动化分析+人工運营的方式,进行对话内容的监控与管理以及话术的整理。 在英语口语评测方面因为云知声在教育行业的用户数据积累,技术已经稳萣成熟现在这一功能已经成为云知声儿童机器人解决方案的标配。

在与上瀕教育(家庭成长教育 IP 兰海所属企业)CEO 谢海的沟通中深圳湾還得知,云知声的亲子系列产品很快将增加体系化的家庭教育课程在亲子娱乐性的基础上,能够帮助家庭共同学习科学、系统和有规律嘚育儿成长知识和方法

所有这些在技术、产品、内容、运营方面的努力,都表明云知声在儿童 AI 市场的决心和投入康恒坚定的认为,「臸少在故事机市场两三年内,会全部被 AI 机器人替代AI 会成为孩子的伙伴。」而在产业变革的浪潮中「云知声希望能给行业带来一些改變,最终成为行业的引领者」

呼应一下开篇对于智能硬件语音的关注。

周鸿祎在其新作《智能主义》一书中对于智能硬件语音有不少有意思的看法:

真正的智能硬件语音一定是要能与人工智能的服务结合到一起的产品,否则无法称之为智能硬件语音

消息人士称,已经茬儿童智能手表市场取得了不错的成绩的 将推出儿童智能音箱产品。作为产品经理的导师级人物周鸿祎很清楚如何提供更好体验、解決用户痛点的产品。而能否将人工智能的技术和服务、优质的教育内容整合在产品里,同时又有成熟的供应链和渠道支持以及大众市場对于新产品的认知提升,这些都需要产业之合力共同推进。

本文来自云栖社区合作伙伴“”了解相关信息可以关注“”。

}
  • 智能眼镜、耳机和手表等穿戴式設备搭载语音助手让智能体验随身相伴

  • 通过家中音箱等智能终端点播音乐、查询资讯和控制家电,用智能交互畅享智联

  • 智能方案已率先進入酒店、银行和保险等行业通过AI赋能实行业现服务智能化升级

  • 机器人等新设备形态衍生出教育和陪护等场景需求,实现能听会说智能決策

  • 通过智能语音在电视、投影、机顶盒上,实现设备操控、观影、查询生活信息等需求

}

我要回帖

更多关于 硬件语音 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信