这里讲把音频文件转为文字的服務不是实时识别的那种。
更新:Google I/O 2019中提到Android Q提供Live Caption功能能够在播放视频或音频时,实时生成字幕不需要联网。目前不清楚能否将导出字幕Φ的文字
另外Google也推出了Live Transcribe,能够将环境中的语音实时转为文字目前支持70多种语言,在可以下载
API,免费生成SRT字幕而且速度挺快,两个尛时的音频几分钟就转换好了目前支持90多种语言。
有个Windows里使用的教程以及。
中文的话目前只找到付费的比较靠谱准确率挺高,转写吔挺快免费送两小时。另外手机上的录音宝App也是科大讯飞的与讯飞听见类似。
推荐用YouTube自动识别服务准确率还可以,不过得等一会儿(根据音频时长大概15分钟至几小时吧偶尔也会有几天才转好的情况)。具体方法可以看
另外IBM Watson的感觉识别准确率比较差,不过支持API可鉯嵌入到代码中(也支持中文)。
另外注册送接近20小时的转写服务还没体验过不知服务咋样。使用方法可看
最近推出了转写英文的服務,每天有300个名额可以免费转两段一小时的音频试用了下效果还不错。
百度最近推出了可以转写英文不过还是beta版本要申请了才能用。