华镇电子的清华大学 语音识别别技术怎么样?

华镇电子,是一家专注于物联网人工智能服务,国内顶尖的语音识别并拥有自主知识产权的高新技术企业,公司发布的物联网人工智能-语音大脑开放平台,集成端+云方案,目前已经在物联网,智能家电,智能家居,智能硬件,智能工控等领域有广泛的应用,形成了完整的语音大脑产品生态链。公司专注于声学前言技术和人工智能交互等核心技术的研发,致力发展于真实环境下更自由的语音控制,语音交互等人工智能的场景。目前公司客户有海尔、海信、方太、志高空调、杜亚电机等几十家国内一线品牌。
公司地址:上海市闵行区申旺路789号,慧高光创园 307室
(邮编:201180)
公司官网:
*发布本招聘广告企业的营业执照名称:上海华镇电子科技有限公司
该公司所有职位
筛选:所有
1年经验 | 本科 | 招2人
上海-闵行区
0.8-1.5万/月
1年经验 | 大专 | 招3人
上海-闵行区
地区人才网招聘地区人才网招聘
微信服务号
未经51job同意,不得转载本网站之所有招聘信息及作品 | 无忧工作网版权所有&日,有“互联网女皇”之称的玛丽·米克尔在美国Code大会上第21次公布了年度《互联网趋势》报告,阐述了2016年最为重要的全球互联网现象、判断以及发展趋势。
报告称,在技术终端和平台方面,持续近十年的以智能手机为核心的移动互联网模式正逐步增速放缓,而在家居、车载和移动场景中,新的以语音为核心的交互模式渐成风口,巨头和创新者纷纷涌入。
这份报告的依据是亚马逊的智能音响Echo的被热捧,这款在2014年底推出的基于语音识别的音响再次引发了业内的关注,甚至被喻为未来智能家居的真正入口。
语音识别的历史其实已经很久,在PC时代,IBM就搞过语音输入。在智能手机流行之前,金立的语音王就可以实现一些语音控制的功能。
而苹果的Siri、谷歌的Google Now和微软的Cortana,都比Echo要早,国内百度也很早就在研发语音识别。
那么语音识别为何现在才被认为是未来趋势,它会给我们带来什么呢?
一、 从Echo说起
实际上,Amazon在Echo上的语音技术在2011年就已经起步,其先是收购语音识别公司Yap。
Yap成立于2006年,主要提供语音转换文本的服务。
2012年,Amazon又收购了语音技术公司Evi,继续加强语音识别在商品搜索方面的应用,不得不提的是,Evi这家公司也曾经应用过Nuance的语音识别技术。
2013 年,Amazon继续收购语音技术公司Ivona Software,Ivona是一家波兰公司,主要做文本语音转换,其技术已被应用在Kindle
Fire的文本至语音转换功能、语音命令和Explore by Touch应用之中, Echo也是利用了这项技术。
而亚马逊自主开发。主要包括够在10英尺甚至更远的地方分辩声音的麦克风阵列技术。
由此不难看出,亚马逊很早就已经通过并购与自研的方式进入到语音识别领域,只是此前相当低调而已,更为关键的是,其拥有自己语音识别的核心技术——采用了非线性排列的远程麦克风阵列(7个麦克风)。这使得相比Siri、Google
Now、Cortana这些存在于手机的语音助手,Echo最大的优势还在于它超强的听力。
而比技术更重要的是应用,苹果的Siri、谷歌的Google
Now基本都是面向智能手机这类移动设备,微软的Cortana除了智能手机,还面向传统PC。而这些设备都有其他输入方式,语音并非是有优势的解决方案。语音指令不如点一下鼠标或者动一下手指,输入速度也必比得上键盘。
而亚马逊则是通过音响这种取巧的方式来应用,对音响来说,语音控制比拿起遥控器或者手机更方便一些,其实智能家居都是语音控制更方便。
好的途径带来更好的市场,Intelligence Research
Partners预计,亚马逊已销售出了大约300万台Echo,其中在今年的第一季度就销售了100万台。
在技术上,亚马逊并不是很出类拔萃,但是他给语音识别指令遭到了一个好的途径。
二,语音识别的真正突破
其实,玛丽·米克尔说的东西并不是那么有权威,而凑巧的是,语音识别在最近两年确实取得了很大的突破。
前不久,麻省理工学院(MIT)主办的知名科技期刊《麻省理工科技评论》(MIT Technology
Review),评选出了“2016年十大突破技术”。《麻省理工科技评论》称,在过去的一年里,这十项技术均已到达一个里程碑式的阶段或即将到达这一阶段。
而语音识别的突破就在其中的第三项,语音接口(Conversational
Interfaces),该技术现已趋于成熟。通过该技术,可将语音识别和自然语言理解相结合,为全球互联网市场创造切实可用的语音接口。
百度、谷歌、苹果、Nuance通信公司、Facebook等公司是这一领域的大玩家。
这里有一个问题,就是语音识别和语义识别。单纯的语音识别这个东西技术已经很古老,PC时代IBM的语音输入已经20年了,苹果的Siri根源可以追到更古老的军方监听项目。
而真正的难度在于语义识别,把语音高正确率的转化成文字还不够,而是要听懂人类在说什么,要表达什么意图,这个才是皇冠上的宝石。
而幸运的是,随着近年来人类科技的进步,这方面已经有了很大的突破。
突破首先来自于硬件的进步,这几年计算机飞速发展,特别是GPU通用计算发展,人类有了强大的计算能力。一些过去不可能实用的人工智能算法成为可能。
人工智能中神经网络与深度学习都取得了很大进步,特别是深度学习算法的应用,大幅度提升了语音识别的正确率,并且提供了语义识别的可能。
这方面,国内的百度走得很远,百度语音识别可以做到安静环境下97%准确率,,领先正常人的听力。如今,百度通过CNN(卷积神经网络)与LSTM(长短时记忆模型)的混合建模,连接时序分类(CTC)训练已经做到了真实环境,日常非标准语言的精确识别。
前几天百度联盟会议上,李彦宏展示了嘈杂环境下百度语音识别对各地方言的识别。
这是建立在深度学习对大量语音资料自动学习基础之上的,以前语音识别需要人来控制,现在机器可以自我学习。而且可以理解人的意思。这是革命性的突破。
百度甚至在上海的KFC放了一个机器人,和人自由对话,点餐。这不是编程对固定指令的处理,而是人工智能直接与人对话,理解人的语言。
这是真正的突破。
三、 语音识别的未来
正确识别语音,完成输入和控制,这个东西有一定前途,但是限于其他模式不方便的时候,譬如智能家居,汽车上面,距离太远不便动手,或者手在忙着的时候。
而语义理解,人机对话则是革命性的东西。
这个东西集合上简单的机器控制,意味着人类大部分服务业与窗口行业都可以被替代。
未来,KFC可能只要现在10%的人手,复杂把原料按照规定投进机器就可以了。点餐加工送餐收款全部由人工智能完成。
一家超市,除了保安需要人类以外,可以用无人仓库加人工智能收银员。
语音识别的未来将我们的生活将发生颠覆性的改变。而把握住这个机会的企业,也将成为下一个时代的弄潮儿。
作者:maomaobear | 来源:iDoNews 专栏
Copyright &
上海华镇电子科技有限公司 版权所有 沪icp备号上海华镇电子科技有限公司
地址: 上海闵行区申旺路789号慧高光创园307-308室
电话:021-56766
24小时电话:/
传真:021-
E-mail:wanson#wanson.cn (为防止垃圾邮件,请将#换成@符号)
镇江华镇电子科技有限公司
地址:镇江市学府路301号江苏大学老计算机中心
E-mail:clocktree#wanson.cn(为防止垃圾邮件,请将#换成@符号)
Copyright &
上海华镇电子科技有限公司 版权所有 沪icp备号&说话人识别,也称声纹识别,就是要根据人的声音特征,识别出某段语音是谁所说的,即&闻声知人&。众所周知,每个人的指纹都是唯一的,与此类似,很难找到两个声纹完全一样的人,因此每个人的声纹也是唯一的,这就从理论上为可靠的声纹识别提供了可能。
声纹识别包括两方面的应用,即说话人辨认(Speaker Identification)和说话人确认(Speaker Verification)。
说话人辨认用以判断某段语音是若干人中的哪一位所说的,有时它关心的往往不是第一名的识别结果的正确率,而是前几名的识别结果的正确率,因为它关心的重点是目标说话人是否被漏识,简而言之&宁(在第一候选中)错勿(在后几个候选中)漏&,比如在刑侦跟踪时。
说话人确认则用以确认某段语音是否真正就是某个特定的人所说的,对说话人确认,有时它的策略是&宁拒(识这个说话人)勿错(误地接受)&,比如在银行交易时。
华镇电子的声纹大脑具有以下优点:
文本和语言无关性。用户训练系统和系统对用户的声音进行鉴别和确认,可以是完全不同的文本,完全不同的语言。比如,在用户在系统注册声音时,可以使用中文说一段文学章节,而识别时用户可以用英文谈论计算机的发展方向。
对语音长度没有特殊的要求。只要训练语音不少于8秒、测试语音不少于4秒即可,并可不断累积调整声纹模型的精度;
很高的识别精度:说话人辨认的正确率不小于98%;
所需空间小。每个人的声纹模型存储空间小于5KB;
通过对动态密码语音中的密码内容及请求人身份的双重识别,实现对操作人身份合法性的双重验证。需要认证时,系统会随机产生一组动态码(如6位或8位数字)要求用户朗读,系统对用户读出的声音进行语音识别并将识别的内容与发出的动态码数字进行比对,同时系统对用户的发音进行声纹比对,两种认证手段都通过时才判断认证通过。用户说出语音密码,验证语音密码是否是本人所说,语音密码内容是否正确,用来鉴别用户身份。
声纹大脑应用领域:
声纹指纹锁
智能保险箱保险柜
智能门禁考勤
Copyright &
上海华镇电子科技有限公司 版权所有 沪icp备号Copyright &
上海华镇电子科技有限公司 版权所有 沪icp备号}

我要回帖

更多关于 语音识别技术难点 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信