人工智能训练师(五级)
模块0 人工智能训练师职业认知
学习单元1 人工智能概论
学习单元2 人工智能训练师岗位认知
模块1 数据采集和处理
课程1-1 业务数据采集
学习单元1 文本与图片数据采集(爬虫)
学习单元2 视频数据采集
学习单元3 语音数据采集
课程1-2 业务数据处理
学习单元1 文本数据清洗
学习单元2 图像数据清洗
模块2 原始数据标注
学习单元1 文本数据标注
学习单元2 图像数据标注
学习单元3 语音数据标注
模块3 Excel的运用技巧
模块4 智能系统运维
学习单元1 智能系统运维基础
学习单元2 常见智能系统介绍
学习单元3 系统功能日志维护
附加0 工作中常用的人工智能软件
-
+
首页
学习单元3 语音数据采集
- #### 以下练习使用本平台在线工具进行学习。 ## 地址:首页->工作台[【快捷链接】](https://zenodt.com/workbench "【快捷链接】"),点击 _1717661367.png) 按钮,登录即可。 ## 1. 语音数据采集步骤  ## 2. PyAudio库 `PyAudio库`提供了录音、播放、流式处理等功能。 ```python # 在命令行里输入下列代码下载 pip install pyaudio # 导入PyAudio库 import pyaudio # 使用PyAudio库提供的函数,实现音频的录制 p = pyaudio.PyAudio() stream = p.open(format=pyaudio.paInt16, channels=1, rate=44100, input=True, frames_per_buffer=1024) frames = [] for i in range(0, int(44100 / 1024 * 5)): data = stream.read(1024) frames.append(data) # 使用PyAudio库提供的函数,实现音频的播放 stream = p.open(format=pyaudio.paInt16, channels=1, rate=44100, output=True) for frame in frames: stream.write(frame) ``` ## 3. Wave库 `Wave库`提供了一系列函数,用于读取、写入和操作音频文件,如WAV、MP3等,还可以用于音频数据的可视化,如音频波形图的绘制等。 ```python # 下载wave库 pip install wave # 导入wave库 import wave # 使用函数,如读取 wave_file = wave.open('example.wav', 'rb') params = wave_file.getparams() nchannels, sampwidth, framerate, nframes = params[:4] frames = wave_file.readframes(nframes) wave_file.close() ``` ## 4. 语音采集库的方法 下列方法均可打开音视频相关文件,并可以处理相关文件。功能有相似又各不相同。 ```python # 获取语音数据,设置参数来指定读取的音频格式、采样率和通道数,降噪、增强等,以提高语音识别的准确性 from scipy.io import wavfile rate, data = wavfile.read('example.wav') # 打开音频文件,设置音频的采样频率、通道数和格式等参数,以满足不同的语音处理需求,读取音频数据,并进行后续的语音处理和分析 wave_file = wave.open('example.wav', 'rb') # 获取音频数据,设置音频采样率、通道数等参数,以满足不同的采集需求,开始采集音频数据,并将采集到的数据存储在缓冲区中 p = pyaudio.PyAudio() stream = p.open(format=pyaudio.paInt16, channels=1, rate=44100, input=True, frames_per_buffer=1024) frames = [] for i in range(0, int(44100 / 1024 * 5)): data = stream.read(1024) frames.append(data) ``` ## 5. 补充学习,请观看下列视频 
张龙
2024年7月24日 16:54
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
分享
链接
类型
密码
更新密码