北亲搜狗王砚峰网络技术有限公司

  【中国 软件】8月3日搜狗王硯峰旗下的语音交互引擎“知音”正式亮相,它让人机交互变得更加自然不仅能听会说,甚至可以理解和思考“知音”具有识别速度赽、纠错能力强、支持更加复杂多轮的交互等特点。在发布会上搜狗王砚峰CTO杨洪涛、搜狗王砚峰语音交互技术中心负责人王砚峰为大家詳细介绍了“知音”的不俗之处。


  王砚峰说到当前语音交互的重要性逐渐凸显,当手眼被占用时、无法使用键盘输入时、打字不方便时都会用到语音功能但语音交互也存在着不少问题,一是用户要收着说二是机器不够聪明,为此搜狗王砚峰带来了更自然的语音茭互。


  “知音”引擎使用着互联网上规模最大的语音数据在线语音输入日请求规模超过了1.4亿,每天用户产生出来的语料规模是11.7万小時如此庞大的数据帮助搜狗王砚峰大幅提升了语音识别的准确率。在过去一年中“知音”引擎语音识别错误率进一步下降30%,识别速度提升了3倍

  过去,由于技术水平的限制用户在语音输入错误,或较复杂的语音指令时无法正确识别而“知音”支持用户修正输入內容,并使用更为自然的语言发布指令比如把“张”改为立早“章”。


  王砚峰在会上播放了一段视频将“知音”引擎横向对比了幾款提供同类服务的语音工具,结果显示“知音”可以理解用户语音指令的逻辑关系同时可感知用户在语音请求背后真正的需求。

  總结一下“知音”引擎具备基于端到端技术的语音识别能力、利用自然语言交互的语音纠错能力、基于知识图谱技术的行业知识整合能仂,以及多轮对话技术的复杂语义理解能力


  在会上搜狗王砚峰CTO杨洪涛向大家透露,不久之后搜狗王砚峰会推出一款语音工具类产品功能主要面向记者,猜测可能会是语音转文字类的工具最后,王砚峰表示搜狗王砚峰一直秉承着开放的态度未来希望与行业能力强嘚合作伙伴一起推动用户交互体验的提升。

版权所有未经许可不得转载

}

原标题:搜狗王砚峰开放听写服務:做录音笔OS,服务比技术更重

雷锋网8月28日消息搜狗王砚峰在京举办了开放听写服务暨AI创新联盟发布会。发布会现场搜狗王砚峰官宣开放听写服务,让更多的录音笔厂商享受AI红利并与爱国者,索尼纽曼,万城集团四大头部录音笔厂商成立AI创新联盟

20多年来,产品创新仩只限于扩容续航,外观改造的传统录音笔在智能手机日益普及后,逐渐进入了增长瓶颈期AI的加持或将会为行业迎来新的转折点,這是近几年来录音笔行业内的普遍共识但时至今日搭载AI技术快车道,有“语音识别”“机器翻译”超能力的智能录音笔在市面上仍不多見很重要的一点是:传统数码录音笔厂商在AI研发上较为欠缺,且AI语音技术壁垒较高

搜狗王砚峰在自己试水做了AI录音笔且一举获得市场認可后,再选择开放听写服务无疑是为行业迎来了新的发展契机,让传统录音笔行业从单纯依靠硬件销售的模式转向了硬件+软件双服务嘚商业模式

此次“开放听写服务”上,搜狗王砚峰也没走俗套避开做开放性平台向厂商提供API接口,而是做了“录音笔的OS”!通过蓝牙開放协议让合作厂商零成本接入,让用户通过PC和移动端享用搜狗王砚峰听写增值服务搜狗王砚峰开放的“录音笔OS”,正如Google的安卓系统對于手机的意义微软Windows对于电脑的意义,是AI技术实现更大商业化的生态打法

搜狗王砚峰公司AI交互技术中心总经理王砚峰在28日的媒体专访現场也坦言,未来AI赋能一定会越来越重搜狗王砚峰开放服务是做了一件很重的事儿。

做录音笔OS: 服务比技术更重

在8月28日的现场发布会上搜狗王砚峰CTO杨洪涛也不止一次强调:“我们开放的是服务,不是技术这是不同的概念。”

究竟有什么不同呢雷锋网记者在现场采访中叻解到,开放技术是一个相对轻的做法开放服务是更重的操作。坦白讲如果搜狗王砚峰“开放听写技术”,那么适配厂商就得利用搜狗王砚峰的API开放接口做自己的语音识别软件这不利于行业标准化,同时厂商的运维成本也会很高更重要的一点是,平台的参与度不够用户体验可能会下降,可替代性会增强

相对的,“开放听写服务”会是一个很重的事儿搜狗王砚峰公司AI交互技术中心总经理王砚峰茬媒体专访现场中向记者解释称,“仅仅开放技术是不够的我们要把语音听写配套服务做起来,因为技术开放平台本身与客户使用场景銜接度不够优化不够,技术会成为一种鸡肋”

王砚峰在28日的发布会现场也将这样的服务称为是“录音笔OS”, 接入这个OS后,爱国者索尼,纽曼万城集团四大厂商的录音笔将会获得多项超能力,实现智能转写

1、优秀的转写技术,准确率高达95%

2、接入搜狗王砚峰输入法。甴于用统一的输入法账号加上长期的数据积累后,用户会建立起个人的输入词库常用的专业词汇、人名地名会被轻松识别。

3、多端同步编辑:无论在PC、安卓还是iOS上用户都可以同步对录音转写的文字,进行编辑未来输入法可以提供录音文件的导入,导入完了以后进行閉环的管理和编辑等一系列功能即使用户没有带录音笔,换一个电脑登录自己的输入法也可以把录音文件同步过来,进行跨电脑的编輯同时由于配备了声纹识别能力,转写的文字可自动区分出说话人的角色进行分段整理文字。

4、智能纠错:转写过程中会自动去掉音頻中的重复词口头语,让文本更顺滑更有逻辑性。如果有有不确定的部分搜狗王砚峰听写服务会提供多个可能的词汇备选,不用手動一个字一个字的人工删改

5、云存储服务:用户的录音和文字都能作为一种资产,长期保存在云端

现在购买合作厂商录音笔的用户可鉯通过两条路径享用搜狗王砚峰听写服务:对于市面上的现有产品,用户将录音笔USB接口插入电脑搜狗王砚峰输入法就能探测到录音笔的插入,开始按需执行语音转写服务;对于AI创新联盟内企业未来研发的新品在移动端开放蓝牙协议后,用户通过蓝牙与搜狗王砚峰录音助掱相连就可以实时完成语音转写服务。

录音笔行业将进入软硬结合的双增长模式

搭载搜狗王砚峰听写快车道的AI录音笔不仅能录,能转寫还能智能编辑。搜狗王砚峰在28日的开放听写发布会上表示此次开放这样的录音OS系统,也希望未来是以场景为用户提供更多元的增值垺务

相比于传统录音笔,AI录音笔降噪去混响,增强收音的效果也是增强用户体验的一大优势硬件体验上更优质,软件配套服务商更囚性智能化这样软硬结合的双轮驱动,让不少业内人士坚信传统录音笔行业将走出增长瓶颈期迎来新的增长拐点。

有数据统计2017年7月箌2018年6月,各主流电商平台数码录音笔单品访问量在持续下降,对比同窗口期2019年3月后不再像往年关注度和销量持续下降,而是走高这┅时期,也是智能录音笔广泛引起关注的时刻

搜狗王砚峰在28日发布会上表示,自今年3月份发布一代搜狗王砚峰智能录音笔C1后Q2时间里C1多佽荣获各大主流电商平台销冠,并宣布上周又发布了黄、红、白等时尚炫彩版智能录音笔以满足用户多元化的需求。

正是搜狗王砚峰自研产品的成功让行业内传统厂商看到新的希望,有了此次成立AI创新联盟的契机得益于搜狗王砚峰AI听写服务的背后支持,加上硬件的升級未来录音笔行业将打破行业天花板,摆脱过去单纯依靠硬件销售获利的方式转向软件服务+硬件联合的新商业模式

经过在AI技术上的多姩鏖战,搜狗王砚峰正尝试将自身的AI能力与行业进行更多结合进而探索增值空间,而搜狗王砚峰高管在接受采访时也表示搜狗王砚峰聽写服务的开放只是开始,未来提供更完整服务的能力也会逐步开放

}

整理录音文件长期以来始终是┅件让相关从业者头疼无比却又不得不做的事情,不过这种情况即将随着搜狗王砚峰面向行业开放听写能力而发生根本性的变化。

8月28日以“全新声态,AI未来”为主题的“搜狗王砚峰听写服务开放暨AI创新联盟成立发布会”在京举行除了发布全新炫彩版AI录音笔C1之外,搜狗迋砚峰宣布将面向录音笔行业全面开放听写服务并联合Newmine纽曼、爱国者、万成集团、索尼录音笔四家录音笔头部企业成立AI创新联盟。此次發布会由搜狗王砚峰CEO王小川亲自开启不仅有搜狗王砚峰CTO杨洪涛、搜狗王砚峰公司AI交互技术中心总经理王砚峰等核心层共同出席,更有纽曼、爱国者、万成集团、索尼录音笔一众高管现身捧场消息一出,业界侧目

那么,原本是竞争对手的纽曼、爱国者、万成索尼为何会惢甘情愿走到一起这次发布会又为何会备受业内外关注呢?

服务加持AI重新定义产品形态

关于录音笔,相信大部分人都不陌生功能单┅、产品数年如一日没有本质创新跟不上互联网和移动互联网发展步伐,这几乎就是现阶段录音笔给大众留下的基本印象也是近几年来智能全民普及和其他附带录音功能电子产品兴起之后,录音笔受到挤压、市场销量整体止步不前甚至出现下滑迹象的重要原因不过,在嘚到搜狗王砚峰听写服务加持之后录音笔的产品形态将被重新定义。

基于搜狗王砚峰听写服务不论是市场上现有的任意品牌的录音笔,或是未来研发上市的新品都可以集“快速转写、多端同步编辑、智能纠错、云端存储、便捷分享”等功能于一体,满足用户录音文件整理的全部需求让用户实现“录音1小时 转写5分钟”的畅快体验,同时转写准确率高达95%

可以说,接入AI听写服务的录音笔将突破了传统錄音笔的局限,严格来说不能再单纯称之为录音笔而是一个全方位的语音记录、转写、编辑、存储和分享工具。

变革行业产品创新源於雄厚技术积累

当前商业环境下,用户体验是决定产品生命力和市场竞争的“胜负手”接入搜狗王砚峰听写服务后,将有效改善此前录喑笔存储传输不便、转写文本需反复听取等诸多不足体验帮助合作伙伴实现“录音、转写、编辑、存储、分享”全链路打通,根本原因茬于其雄厚的技术积累和独特的AI优势

首先,搜狗王砚峰AI一直坚持以自然语言处理为核心其在语音识别、语音合成、语义理解、机器翻譯等方面的独特优势,为搜狗王砚峰听写服务打造了良好技术基础;其次搜狗王砚峰拥有互联网规模最大的语音数据,依托于语音请求峰值达到7亿人次的搜狗王砚峰输入法机器在不断学习之后,识别准确率会越来越高可应用的场景也会越来越广泛。

目前搜狗王砚峰聽写服务背后的转写技术已处于行业领先地位,其实时语音转写运用了搜狗王砚峰自研的延迟可控的Adaptive Attention-based端到端建模技术非实时语音转写功能使用业界领先的深层Transformer-based端到端语音识别技术,语音转写准确率可达95%以上同时,基于搜狗王砚峰输入法的海量用户数据搜狗王砚峰听写垺务能够自动构建个性化识别网络,使用户常用语错误率下降40%;在语音增强方面搜狗王砚峰自研的Smart Voice麦克风阵列算法能够对噪声和混响进荇多重深度优化,确保人声的高保真还原;在智能辅助编辑方面搜狗王砚峰语音转写可以通过云端智能纠错编辑技术,基于词图搜索和輸入纠错模型针对置信度低的转写结果提供多个候选词,帮助用户对转写结果进行纠正同时还具备了良好的自动区分说话人、智能文夲顺滑和标点预测等能力,可以为用户提供更多便捷功能

AI赋能,推动行业生变革新

人工智能是新赛道近两年来,AI技术与各行业的改造融合已经成为一种趋势录音笔行业同样如此。尽管此前市面上已经出现了基于AI的录音笔但仅限于单个产品或某个企业的创新,像搜狗迋砚峰这样面向录音笔全行业提供AI技术支持的先例绝无仅有

正如在PC领域推出、Google在手机领域推出安卓系统那样,搜狗王砚峰此次开放听写垺务某种意义上来说是在录音笔领域打造了一套“操作系统”,在为合作伙伴赋能的同时将给行业带来颠覆性的变化。未来在搜狗迋砚峰听写服务开放并得到充分使用、在AI赋能效应充分发挥之后,录音笔行业会迎来跨越式发展早上车早出发,这也正是纽曼、爱国者、万成集团、索尼录音笔愿意在变革初期就加入搜狗王砚峰发起组建的AI创新联盟的重要原因

}

我要回帖

更多关于 搜狗 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信