%================================================
%&#x4F5C;&#x8005;&#xFF1A;Uestc-Sl
%&#x521B;&#x5EFA;&#x65E5;&#x671F;&#xFF1A;2021.04.19
%&#x7EF4;&#x62A4;&#x65E5;&#x671F;&#xFF1A;2021.04.19
%&#x529F;&#x80FD;&#x63CF;&#x8FF0;&#xFF1A;&#x5C06;&#x526A;&#x5207;&#x58F0;&#x97F3;&#x4E0E;&#x5224;&#x65AD;&#x7537;&#x5973;&#x58F0;&#x529F;&#x80FD;&#x76F8;&#x7ED3;&#x5408;&#xFF0C;&#x5B9E;&#x73B0;&#x526A;&#x5207;&#x3001;&#x8BC6;&#x522B;&#x3001;&#x5206;&#x7C7B;&#x5B58;&#x50A8;&#x4E00;&#x7CFB;&#x5217;&#x529F;&#x80FD;
%&#x8C03;&#x7528;&#x51FD;&#x6570;&#xFF1A;judge.m
%&#x4F7F;&#x7528;&#x6D41;&#x7A0B;&#xFF1A;&#x70B9;&#x51FB;&#x8FD0;&#x884C;--->&#x9009;&#x62E9;&#x539F;&#x59CB;&#x97F3;&#x9891;&#x6587;&#x4EF6;--->&#x9009;&#x62E9;&#x526A;&#x5207;&#x53CA;&#x8BC6;&#x522B;&#x5206;&#x7C7B;&#x540E;&#x7684;&#x6587;&#x4EF6;&#x8F93;&#x51FA;&#x76EE;&#x5F55;---->&#x526A;&#x5207;&#x97F3;&#x9891;
%         ----->&#x8BFB;&#x53D6;&#x526A;&#x8F91;&#x7684;&#x97F3;&#x9891;&#x5E76;&#x8BC6;&#x522B;---->&#x6839;&#x636E;&#x8BC6;&#x522B;&#x7ED3;&#x679C;&#x5C06;&#x8BE5;&#x8BED;&#x97F3;&#x5B58;&#x5165;&#x5BF9;&#x5E94;&#x5206;&#x7C7B;&#x6587;&#x4EF6;&#xFF0C;&#x4EE5;&#x4FBF;&#x4EBA;&#x5DE5;&#x6821;&#x5BF9;---->&#x7ED3;&#x675F;
%&#x8F93;&#x51FA;&#x7ED3;&#x679C;&#x6587;&#x4EF6;&#x5939;&#x53CA;&#x76EE;&#x5F55;&#x7ED3;&#x6784;     &#x6307;&#x5B9A;&#x8DEF;&#x5F84;----> interval_2_0?-1 ---> &#x526A;&#x5207;&#x597D;&#x7684;&#x97F3;&#x9891;
%                                                         --->&#x7537;&#x58F0;
%                                                         --->&#x5973;&#x58F0;
%                                                         --->&#x9700;&#x4EBA;&#x5DE5;&#x8BC6;&#x522B;
%&#x5907;&#x6CE8;&#xFF1A;
%&#x5176;&#x4ED6;&#xFF1A;&#x53EF;&#x8003;&#x8651;&#x5F15;&#x5165;&#x795E;&#x7ECF;&#x7F51;&#x7EDC;&#xFF0C;&#x6784;&#x5EFA;&#x66F4;&#x9AD8;&#x7EF4;&#x5EA6;&#x7684;&#x5411;&#x91CF;&#xFF0C;&#x63D0;&#x9AD8;&#x57FA;&#x4E8E;&#x5224;&#x65AD;&#x5E45;&#x503C;&#x548C;&#x57FA;&#x97F3;&#x9891;&#x7387;&#x5224;&#x65AD;&#x7684;&#x51C6;&#x786E;&#x6027;
%================================================

 clear;
 clc;
 [file1,PathName,FilterIndex] = uigetfile('.wav','Select the M-file');
 file=strcat(PathName,file1);
 outfilePath=uigetdir;
 %======================&#x521B;&#x5EFA;&#x8F93;&#x51FA;&#x7ED3;&#x679C;&#x6587;&#x4EF6;=========================
 new_folder0 = strcat(outfilePath,'\','interval_2_',file1(1:4)); % &#x521B;&#x5EFA;&#x4E00;&#x4E2A;&#x52A0;&#x524D;&#x7F00;&#x7684;&#x540C;&#x540D;&#x6587;&#x4EF6;&#x5939;&#xFF0C;&#x4FDD;&#x5B58;&#x5904;&#x7406;&#x540E;&#x7684;&#x6570;&#x636E;
 mkdir(new_folder0);
 new_folder1 = strcat(new_folder0,'\','&#x526A;&#x5207;&#x597D;&#x7684;&#x97F3;&#x9891;');
 mkdir(new_folder1);
 new_folder2 = strcat(new_folder0,'\','&#x7537;&#x58F0;');
 mkdir(new_folder2);
 new_folder3 = strcat(new_folder0,'\','&#x5973;&#x58F0;');
 mkdir(new_folder3);
 new_folder4 = strcat(new_folder0,'\','&#x9700;&#x4EBA;&#x5DE5;&#x8BC6;&#x522B;');
 mkdir(new_folder4);
 %=============================================================

 [x,fs]=audioread(file); % &#x8BFB;&#x5165;&#x58F0;&#x97F3;&#x6587;&#x4EF6;
 data=x(:,1);            % &#x53D6;&#x5355;&#x58F0;&#x9053;
 len=length(data);       % &#x83B7;&#x53D6;&#x5E8F;&#x5217;&#x957F;&#x5EA6;&#x548C;&#x6DF1;&#x5EA6;
 timeInterval=2;         % &#x63D0;&#x53D6;&#x7684;&#x65F6;&#x95F4;&#x95F4;&#x9694;&#xFF08;s&#xFF09;

for i=1:ceil(len/fs)
    start_time = timeInterval*(i-1);
    end_time =timeInterval*i;
     if end_time*fs <=len y_new="x((fs*start_time+1):fs*end_time,1);" outfilename="strcat(new_folder1,'\',num2str(i),'.wav')" audiowrite(outfilename,y_new,fs); %将分割好的音频存入指定文件 [ansnum]="judge(OutFileName);" if ansnum="=0" %男声 outfilename2="strcat(new_folder2,'\',num2str(i),'.wav');" audiowrite(outfilename2,y_new,fs); end %女声 outfilename3="strcat(new_folder3,'\',num2str(i),'.wav');" audiowrite(outfilename3,y_new,fs); %需人工识别 outfilename4="strcat(new_folder4,'\',num2str(i),'.wav');" audiowrite(outfilename4,y_new,fs); < code></=len>

（2）子函数judge.m

%&#x8FD4;&#x56DE;&#x503C; 0 &#x7537;&#x58F0;
%       1 &#x5973;&#x58F0;
%       2 &#x9700;&#x4EBA;&#x5DE5;&#x8BC6;&#x522B;
function [ansnum]=judge(filename)

    [x1,fs1]=audioread(filename); % &#x8BFB;&#x5165;&#x58F0;&#x97F3;&#x6587;&#x4EF6;
     data1=x1(:,1);            %&#x53D6;&#x5355;&#x58F0;&#x9053;

    %======&#x57FA;&#x97F3;&#x9891;&#x7387;&#x63D0;&#x53D6;======
    N=length(data1);
    [~,index]=max(data1);          % &#x8FD4;&#x56DE;&#x6700;&#x5927;&#x503C; &#x6700;&#x5927;&#x503C;&#x7D22;&#x5F15;
    timewin=floor(0.015*fs1);

    %&#x907F;&#x514D;&#x6EA2;&#x51FA;
    [a,ind] = sort(data1);
    count=1;
    while index+timewin>N
         a(end)=[];
         count=count+1;
         [~,index]=max(a);
    end
    temp=index-timewin;
    if temp<0 temp="1;" end xwin="data1(temp:index+timewin);" [y,~]="xcov(xwin);" ylen="length(y);" halflen="(ylen+1)/2" +30; yy="y(halflen:" ylen); [~,maxindex]="max(yy);" fmax="fs1/(maxindex+30);" disp([filename,'基音频率为 ', num2str(fmax), ' hz']) %="===============&#x8003;&#x8651;&#x5E45;&#x503C;&#x4FE1;&#x606F;======" mean="0;" for i="1:N" if data1(i)>0
        mean=mean+data1(i);%&#x53EA;&#x8BA1;&#x7B97;&#x6B63;&#x503C;&#x8303;&#x56F4;&#x5185;&#x7684;&#x5E73;&#x5747;&#x5E45;&#x503C;
        end
    end
    mean=mean/N

    %======&#x901A;&#x8FC7;&#x57FA;&#x97F3;&#x9891;&#x7387;&#x3001;&#x5E45;&#x503C;&#x5927;&#x5C0F;&#x5224;&#x65AD;&#x7537;&#x5973;&#x58F0;======
    if mean>=0.001 && fmax<160 disp([filename,' 是男声文件']); ansnum="0;" else if fmax<160 && fmax>100 ;
            disp([filename,' &#x9700;&#x4EBA;&#x5DE5;&#x8BC6;&#x522B;']);
            ansnum=2;
         else
            disp([filename,' &#x662F;&#x5973;&#x58F0;&#x6587;&#x4EF6;']);
            ansnum=1;
         end;
    end;
    </160></0>

3 代码运行结果

语音识别之男女声分类（从一段对话中分离男声）

图3.1 输出结果文件夹

语音识别之男女声分类（从一段对话中分离男声）

图3.2 判定为"男声"音频文件夹

语音识别之男女声分类（从一段对话中分离男声）

图3.3 判定为"女声"音频文件夹

语音识别之男女声分类（从一段对话中分离男声）

图3.4 判定为"需人工识别"音频文件夹

每次处理输入的语音时，首先会创建一个文件夹用于存处理完成后的数据，文件夹命名为"interval_2_"+输入文件名的前四个字符，并在该文件夹下创建四个文件夹：剪切好的音频、男声、女声、需人工识别。随后会自动分割录音音频为2s一段的音频，并存入"剪切好的音频"文件夹，然后对剪切好的语音进行识别并存入对应文件夹。

4 结论

根据本人人工校对后发现，"男声"的查准率近乎100%，查全率约80%（正常情况下），达到了预期的效果。在这些已分类后的语音基础上再进行人工进行校对分类，大大提高了音频剪切效率，故分享给大家，希望能给用得上的朋友带来帮助。

5 参考资料

【1】http://www.voidcn.com/article/p-hsevylyj-nx.html

【2】https://blog.csdn.net/qq_31821675/article/details/79973532?utm_medium=distribute.pc_relevant_download.none-task-blog-baidujs-4.nonecase&depth_1-utm_source=distribute.pc_relevant_download.none-task-blog-baidujs-4.nonecase

【3】https://blog.csdn.net/weixin_29813667/article/details/113902853

【4】https://ww2.mathworks.cn/help/matlab/ref/mkdir.html

Original: https://blog.csdn.net/qq_38719138/article/details/116207726
Author: automan2019
Title: 语音识别之男女声分类（从一段对话中分离男声）

语音识别之男女声分类（从一段对话中分离男声）

0 引言

1 思路

2 代码

（1）主函数

（2）子函数judge.m

3 代码运行结果

4 结论

5 参考资料

猿创征文｜时间序列分析算法之平稳时间序列预测算法和自回归模型(AR)详解+Python代码实现

logistic回归模型—基于R

环境混合物总体效应：加权分位数和回归（WQS）

数学建模学习：岭回归和lasso回归

R 计算均方差MSE(mean squared error)

python数据相关性绘图-散点图正态分布图回归图等及鸢尾花数据集可视化（附Python代码）

基于Lasso回归的实证分析（Python实现代码）

目标检测中边框回归的直观理解 bbox regression

通过R语言实现平稳时间序列的建模–基础（ARMA模型）

【sklearn使用】sklearn中调用R2（回归问题评价指标）的3种方式

【项目实战】Python实现GBDT(梯度提升树)回归模型(GradientBoostingRegressor算法)项目实战

机器学习算法系列（四）- 岭回归算法（Ridge Regression Algorithm）

stata基础–回归，画散点图，异质性分析

机器学习之分类回归树（CART）

机器学习基础：用 Lasso 做特征选择

利用lasso回归建立预测模型并绘制列线图二分类结局资料的lasso回归与列线图绘制

计量经济学笔记6-Eviews操作-自相关的检验与消除（DW、LM检验与FGLS、广义差分变换）

Pytorch：全连接神经网络-MLP回归

机器学习实验——回归预测算法

基于MATLAB的随机森林（RF）回归与变量影响程度（重要性）排序

机器学习算法、Python、数据分析、学习资料 & 面试大汇总（免费送）

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30