企业项目管理、ORK、研发管理与敏捷开发工具平台

网站首页 > 精选文章 正文

殊途同归python第2节:音频转文字

wudianyun 2025-05-26 19:28:31 精选文章 6 ℃

wave 包可直接对 .wav 音频进行读取,写入,以及获取声道、采样频率等信息。直接上代码

import wave

#简单处理wav音频神器

w = '文件1.wav'

u = '新文件1.wav'

with wave.open(w,'rb') as wf:#读取wav格式文件

a = wf.getnchannels()#声道数

b = wf.getsampwidth()#采样位数

c = wf.getframerate()#采样频率

d = wf.readframes(c)#获取音频数据

wf.close()

with wave.open(u,'rw') as uf:#创建wav格式文件

e = uf.writeframes()#写入音频数据

uf.close()



结合vosk 包,可实现音频转文字,关键代码如下:

from vosk import Model,KaldiRecognizer

mo_path = r'vosk-model-cn-0.22' #中文字包

rec = KaldiRecognizer(mo,wf.getframerate())


while True:

data = wf.readframes(4000)

if len(data)==0:

break

else:

pass

b = rec.FinalResult()#b 即为音频对应的文字


关注点赞,编程原来如此简单

Tags:

最近发表
标签列表