数据集介绍
- EMO-DB数据集是由柏林工业大学录制的德语情感语音库
- 535条语音文件(一共有十名演员其中五男五女)其中语句内容包含日常生活用语的5个短句和5个长句,具有较高情感自由度,不包含某一特定情感倾向。采用16kHZ采样,16bit量化,并以WAV格式保存文件。
- 其中情绪组成:anger, neutral, fear, boredom, happiness, sadness, disgust.

主要是用到这个语音标签 audio 文件的XXXWa.wav中W就是情绪

提取相关特征
import feature
import os
import pickle
import tqdm
def extract_emodb(file_name:str):
label = file_name.split('.')[0][-2]
feature_27 = feature.extract_mfcc_feature(file_name)
return (label,feature_27)
database_dir =

该博客介绍了EMO-DB数据集,这是一个包含535条德语情感语音的库,由10名演员(5男5女)录制,情绪包括愤怒、中性、恐惧等。数据集以16kHz采样率、16bit量化保存为WAV文件。博客详细展示了如何提取MFCC特征,并提供了用于读取和处理音频文件的代码。

1万+

被折叠的 条评论
为什么被折叠?



