语音转文字哪家强?讯飞听见帮你忙

上个月参加了一次公益活动的座谈会,会务让我负责会议内容的纪实与整理。我用索尼录音笔将会议的全程都录了音,时长2小时多。如何将这些语音转换为文字?我原想着要用语音播放器一句一句地听,再逐一打字整理。

有位小伙伴向我推荐了讯飞听见,说通过它的“机器快转”后获得初稿,再进行重听录音校对,补充完善内容,效率会高很多。

讯飞,我还是有印象的,其出品的讯飞输入法,曾是最好的手机输入法,特别是在语音输入上有优势。

讯飞听见是个收费服务项目,看了下报价,中文机器快转,每分钟0.33元,官方宣称,准确率最高可达 95% 以上,1 小时音频最快 5 分钟出稿。新注册用户有多种优惠,我估摸算了一下,费用应该不会太大,就想尝试一下。

注册为用户,语音转文字–机器快转–上传音频。机器快转上传文件,最多可添加50个音、视频文件;会员用户最多可添加100个音、视频文件。支持 mp3、mp4、wav、pcm、m4a、amr、wma、3gp、aac格式,单个文件不超过2G 且时长不超过5小时。适用性还是非常广泛的。

上传音频文件后,讯飞听见支持查看前一分钟的转写预览,我们可看下转写的效果。支持填写音频中出现的关键字,以帮助获得更精准结果,单个词最多允许16个字符,词间用逗号隔开。确认订单信息栏,应选择“中文机器快转”,出稿类型选择“文稿”,专业领域可选填,以提高识别率,应该是更易识别一些专业用语。

“确认订单”后,进入付款流程,支持支付宝和微信支付,我这段时长 2:19:23 的录音,费用总价是46元,折扣优惠后实付了6.4元,很划算呀。完成支付后,即进入转写,机器快转,一般1小时的音频最快5分钟出稿,过了10分钟,我就收到了完成转写的短信提醒,在“转写订单”列表页看到订单显示“已完成”。

点击“查看结果”,就看到了转写的内容,我们可直接“下载本条结果”到本地,再进行校对,也可以直接进行编辑,鼠标移到文字上,可重听这段录音,在线校对。播放速度可调整为1倍,1.25倍,1.5倍,可过滤语气词,或跳过静音段,可直接在播放条中控制上一句、下一句。完成在线校对后,保存编辑,再导出结果。

我发现讯飞听见的机器快转准确率还是非常高的,我们正常耳朵能识别的发言,绝大多数都转写出来了,有些女生声音比较轻的话,成功率就低一点了,这可能也得益于索尼录音笔良好的录音和降嗓功能吧。

如果在线校对的话,发现讯飞听见的分句功能还不是特别好,有些一两个字就一句了,很碎片,在线编辑时不方便。后来,我还是下载到本地,用QQ影音播放,手动控制重听,进行校对,这样反而来得方便。

而在上传音频时输入的音频关键词,好像并没有在识别中起作用,这是有点遗憾的。

另外要说点不算题外话的题外话。受互联网免费午餐思维的惯性影响,当看到讯飞听见时收费服务时,我即想在网上查找了相关的破解版,免费享用这一服务。经过多日的搜索,下载,安装,卸载,可以确认,当前网络上所谓的讯飞听见破解版,都是骗人的假软件,期中推荐最多的科大讯飞 InterPhonic 5.0 ,它只有文字转语音功能,请大家擦亮眼睛,谨慎下载,以防上当。更不要说有些下载网站,借讯飞听见之名,行流氓软件之实,把大把的其他软件下到你电脑里,不经你同意就自动安装,留下安全隐患。

历史上的今天:

语音转文字哪家强?讯飞听见帮你忙》有5个想法

  1. 之前觉得有个视频里面说的很不错,想把视频里的说的转成文字但没有实现。这个有视频语音转文字的功能吗?

    1. 2017年11月,国家公布人工智能四大平台,百度的自动驾驶;阿里云的城市大脑;腾讯的医疗影像;科大讯飞的智能语音。语音是讯飞的强项。

发表评论

电子邮件地址不会被公开。 必填项已用*标注