学习单元3　语音数据采集

- #### 以下练习使用本平台在线工具进行学习。
## 地址：首页->工作台[【快捷链接】](https://zenodt.com/workbench "【快捷链接】")，点击 ![](/media/202406/企业微信截图_17176610853953(1)_1717661367.png) 按钮，登录即可。

## 1. 语音数据采集步骤

![](/media/202407/2024-07-18_161721_3501990.49090248794948266.png)

## 2. PyAudio库
`PyAudio库`提供了录音、播放、流式处理等功能。

```python
# 在命令行里输入下列代码下载
pip install pyaudio

# 导入PyAudio库
import pyaudio

# 使用PyAudio库提供的函数，实现音频的录制
p = pyaudio.PyAudio()
stream = p.open(format=pyaudio.paInt16,
                channels=1,
                rate=44100,
                input=True,
                frames_per_buffer=1024)
frames = []

for i in range(0, int(44100 / 1024 * 5)):
    data = stream.read(1024)
    frames.append(data)

# 使用PyAudio库提供的函数，实现音频的播放
stream = p.open(format=pyaudio.paInt16,
                channels=1,
                rate=44100,
                output=True)

for frame in frames:
    stream.write(frame)
```

## 3. Wave库
`Wave库`提供了一系列函数，用于读取、写入和操作音频文件，如WAV、MP3等，还可以用于音频数据的可视化，如音频波形图的绘制等。

```python
# 下载wave库
pip install wave

# 导入wave库
import wave

# 使用函数，如读取
wave_file = wave.open('example.wav', 'rb')
params = wave_file.getparams()
nchannels, sampwidth, framerate, nframes = params[:4]
frames = wave_file.readframes(nframes)
wave_file.close()
```

## 4. 语音采集库的方法
下列方法均可打开音视频相关文件，并可以处理相关文件。功能有相似又各不相同。

```python
# 获取语音数据，设置参数来指定读取的音频格式、采样率和通道数，降噪、增强等，以提高语音识别的准确性
from scipy.io import wavfile
rate, data = wavfile.read('example.wav')

# 打开音频文件，设置音频的采样频率、通道数和格式等参数，以满足不同的语音处理需求，读取音频数据，并进行后续的语音处理和分析
wave_file = wave.open('example.wav', 'rb')

# 获取音频数据，设置音频采样率、通道数等参数，以满足不同的采集需求，开始采集音频数据，并将采集到的数据存储在缓冲区中
p = pyaudio.PyAudio()
stream = p.open(format=pyaudio.paInt16,
                channels=1,
                rate=44100,
                input=True,
                frames_per_buffer=1024)
frames = []
for i in range(0, int(44100 / 1024 * 5)):
    data = stream.read(1024)
    frames.append(data)
```

## 5. 补充学习，请观看下列视频
![=video_iframe](https://www.bilibili.com/video/BV14c411E7vX/?spm_id_from=333.337.search-card.all.click)

学习单元3 语音数据采集

学习单元3　语音数据采集