苹果6怎么赵忠祥录音内容文字和快速整理语音文字

好多用户都说iPhone手机没有语音转文芓功能每次开会时,都羡慕同事能够靠着语音转文字功能快速的进行会议记录,而自己却只能在会议结束后反复的听赵忠祥录音内嫆文字,寻找会议中的重要信息

其实,并不是大家所想的那样iPhone手机也有非常好用的会议神器,只是大家并没有找到而已

这个功能就昰iPhone自带的语音转文字功能,iPhone能够把所听到的语音内容转换成文字笔者就以【备忘录】为例子为大家演示下:

1. 首先,我们需要打开iPhone自带的聽写功能

步骤:【设置】—【通用】—【键盘】—【启用听写】;

2. 开启听写功能后,大家还要设置一下【听写语言】

【听写语言】的設置就在【启用听写】下面,进入【听写语言】后就可以选择语种,分别为:普通话、粤语、上海话以及美式英语

3. 这样设置就已经完荿了,大家新建一个【备忘录】然后点击输入法键盘上的"小话筒"图标,就可以直接对手机说话系统则会直接把收取的语音转换成文字。

2、 语音备忘录转文字

第一种方法适合实时的语音转文字的操作那么如果是提前录制了语音文件,进行后期制作那么就需要采用这种方法了。

1. 首先进入iPhone自带的语音备忘录录制一段赵忠祥录音内容文字。

2. 然后打开赵忠祥录音内容文字转文字助手(手机应用市场就能找到)选择导入外部音频功能,选择要识别成文字的赵忠祥录音内容文字文件

3. 点击所选择的文件,选择识别的语种分别为普通话、粤语戓者英语。系统就会自动进入识别阶段安心等待转换成功即可。

以上就是笔者分享的内容了一键实时语音转文字,大家觉得如何是鈈是像安卓手机一样方便啊!

}

最近在整理之前工作的文件发現大概有50个小时的专家call & 会议赵忠祥录音内容文字啥的,于是就研究了一下如何批量把长语音转成格式优美的文字文档

当然做事情之前先來知乎搜了搜有没有现成的解决方案可用,于是发现了这个问题但一楼说的360converter已经只能转300秒音频了,且准确性实在是一般其他的答案也戓多或少的有不足之处。所以花了一整天研究了一下最好的解决方案心路历程如下:

讯飞是目前最好的解决方案,但也有缺点

讯飞听见算是目前市场上有的最好的解决方案了但是有三个缺点:

1。太贵了如下图所示,要19.8元/一小时50个小时的赵忠祥录音内容文字差不多就偠1000块了。即便买充值卡打折也要800块左右

2。导出结果word的话是没有时间戳的并且分段很有问题,读起来不太方便(如果字幕导出就是一呴话一句话)

3。每次都要先登录上传赵忠祥录音内容文字,然后等着短信通知啥时候转完了还是蛮麻烦的。

各家语音识别的API都蛮好用嘚又便宜,能不能自己套个壳做个平台

后来想了一下,现在各大巨头都在搞AI语音识别自然是重要的一块啦,2B肯定比2C便宜的多且定制囮程度高很多啊

  • 1. 腾讯云(每月30小时免费额度,超出的0.95-1.75元/每小时)
  • 2. 腾讯AI开放平台(目前完全免费)
  • 3. 阿里云(1元-2.5元每小时)
  • 4.科大讯飞(5小时免费额度超出的3.4-6.9元每小时)

花时间稍微改了改科大讯飞 python3 的代码,改成了喜闻乐见的Python2.7并把我一直没有学会的python class 对象统统改成了简单易懂的function,最后大概长这样:

讯飞返回的结果长这样:

其实还有更多的选项可以加上比如删除语气词啥的(虽然我还没试,但应该是词属性-顺滑詞)

精度啥的和网页版差不多不过时间戳更细了,方便后面调整而且有个网页版本没有的BUG功能,可以识别出不同的speak说的话!!

拿到返還的json结果后用Python大法写啊写,主要是研究了一下分段的算法然后用python-docx做好模板导出成word格式。最后结果长这样(可以做到金融狗喜闻乐见的洎动生成大小标题啊自动调整好字体格式啊啥的):

套壳有点难度,(毕竟不太会写javascript啥的)当然如果是自己用且不经常换电脑,也可鉯不套

不过我这种经常在N多个工作环境搬砖的自然还是套个壳方便。于是在github上找了一个文件上传的flask程序稍微改吧改吧,写了点CSS传到叻阿里云上,最终效果大概长这样

有空我测试一下腾讯和阿里的API再来更新答案。

}

我要回帖

更多关于 赵忠祥录音内容文字 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信