EMO-DB 数据集的 Speech 特征提取

该博客介绍了EMO-DB数据集,这是一个包含535条德语情感语音的库,由10名演员(5男5女)录制,情绪包括愤怒、中性、恐惧等。数据集以16kHz采样率、16bit量化保存为WAV文件。博客详细展示了如何提取MFCC特征,并提供了用于读取和处理音频文件的代码。

EMO-DB 数据集的 Speech 特征提取

数据集介绍

- EMO-DB数据集是由柏林工业大学录制的德语情感语音库
- 535条语音文件(一共有十名演员其中五男五女)其中语句内容包含日常生活用语的5个短句和5个长句,具有较高情感自由度,不包含某一特定情感倾向。采用16kHZ采样,16bit量化,并以WAV格式保存文件。
- 其中情绪组成:anger, neutral, fear, boredom, happiness, sadness, disgust.

在这里插入图片描述
主要是用到这个语音标签 audio 文件的XXXWa.wav中W就是情绪
在这里插入图片描述

提取相关特征

import feature
import os
import pickle
import tqdm
def extract_emodb(file_name:str):
    label = file_name.split('.')[0][-2]
    feature_27 = feature.extract_mfcc_feature(file_name)
    return (label,feature_27)


database_dir = 
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值