加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

90块一个小时的音频转文字软件?这也太坑了!六行代码轻松实现!

发布时间:2020-12-17 01:11:57 所属栏目:Python 来源:网络整理
导读:前几天工作中遇到需要把音频转为文字稿的任务,顺便学了个新词语:扒词。 扒词:根据视频信息获得文字信息,即根据录音或者台词,然后转字幕。 拿音频找导演联系扒词,结果导演居然说视频扒词可以,音频就算了吧,算了吧……! ……天下没有免费的午餐。 感

前几天工作中遇到需要把音频转为文字稿的任务,顺便学了个新词语:扒词。

扒词:根据视频信息获得文字信息,即根据录音或者台词,然后转字幕。

拿音频找导演联系扒词,结果导演居然说视频扒词可以,音频就算了吧,算了吧……!

……天下没有免费的午餐。

感谢万能的知乎!让我找到了IBM 爸爸的Speech to text!

第一步

点击首页紫色的那个「Star for free in IBM Cloud」按钮,注册IBM Cloud并登陆(注册不了的亲,记得科♂学上网)。

第二步

添加服务(因为我已经加了服务,没法给大家截图了,自己找找吧),添加后是这样的:

点击现有服务,找到已有的服务。

点击服务名称查看详情。

出现下面这行字说明装好了。

第四步

打开Jupyter Notebook开始写代码啦!

import speech_recognition as sr #加载包

r = sr.Recognizer() with sr.WavFile("E://1.mp3") as source: #请把引号内改成你自己的音频文件路径

audio = r.record(source)

运行这一步发现报错了。

原来要wav格式。推荐一个好用的神器:格式工厂。音频视频文件转格式我都用它,方便小巧。

嗯……虽然准确率没有100%,但也已经比较可观了!!

它支持多种语言,只需要把language变量改成以下这些就可以实现不同语言的转换:

  • ar-AR 阿根廷语
  • en-UK 英式英语
  • en-US 美式英语
  • es-ES 西班牙语
  • fr-FR 法语
  • ja-JP 日语
  • pt-BR 巴西葡萄牙语
  • zh-CN 中文

每个免费账户每个月可使用100分钟,30天不活跃服务将删除。

6行代码轻松音频转文字,你学会了嘛?

终于不用花冤枉钱了!进群:125240963 ?即可获取数十套PDF哦!私信小编需要源码即可获取源码!

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读