实时语音通信的实现 - lanqiaojun的博客

作者在 2008-11-23 11:37:58 发布以下内容

作者：解放军炮兵学院十四队孔康

引言
　　本人虽已学习VC++一年半载，仍觉捉襟见肘，好在有VCKBASE的帮忙，确实学到了不少东西，www.vckbase.com也成了我每次上民网必到之处（阁下有所不知，鄙人接受最为严格的管理，上民网是要申请的）。近日在做一个通信方面的程序，实时的语音和视频通信当然是大家所喜欢的。本文将向您展示局域网环境下实时语音通信的的一个解决方案(视频这一块正在做，估计很快就能出炉)，Winxp环境下测试效果良好，并且具有网络拥塞处理机制，您不妨一看。
　　本文以第26期栾义明先生的《基于API的录音机程序》为基础的，在此深表感谢。雷同之处将不再赘述，主要做了以下发展:

（1）利用多线程机制，实现录音、网络传输、放音同时进行。

（2）网络壅塞处理，保证数据不丢失。

例子程序运行画面：

下面且看我细细道来：

（一）首先定义了一个声音数据“块”

struct CAudioData
{
	PBYTE lpdata; //指向语音数据，注意这里内存区域是动态申请释放的
	DWORD dwLength;//语音数据长度
}

接下来申明两个循环队列和相关指针。

//InBlocks,OutBlocks非别为两个常数
CAudioData m_AudioDataIn[InBlocks],m_AudioDataOut[OutBlocks];
int   nAudioIn, nSend, //录入、发送指针
     nAudioOut, nReceive;//接收、播放指针

// 对于录音和放音都存在和网络的同步问题，主要靠这些指针进行协调

讨论：如图所示，几个指针的相互追逐，这种机制在处理网络拥塞上应该有普遍的应用意义

（1）正常网速下：nAudioIn 在 nSend 之前， nReceive 在 nAuioOu t之前，周而复始的走下去。

（2）超快网速下：发送端：-->nSend追上nAudioIn-->“空转”(绕了一圈又回来了)--〉
接收端：因为录、放音的采样频率设置为相等，故不可能出现 nReceive 在n AudioOut 之后，
即收到的声音文件太多，来不及播放的现象。

（3）超慢网速下：(极端情况，网速几乎为0也没关系)
发送端：nAudioIn 绕一圈反追上 nSend，于是将数据接在当前块的尾部，以待发送
接收端：nAudioOut 追上 nReceive 后，发现没有数据可播放了，就“空转”。

综合以上情况，相关实现如下：

（二）声音的录制与播放

（1）录音处理

void CRecTestDlg::OnMM_WIM_DATA(UINT wParam,LONG lParam)
{
      int nextBlock = (nAudioIn+1)% InBlocks;	
	if(m_AudioDataIn[nextBlock].dwLength!=0)//下一“块”没发走
	{  //把PWAVEHDR(即pBUfferi)里的数据接到当前“块”的末尾
           m_AudioDataIn[nAudioIn].lpdata  
		= (PBYTE)realloc (m_AudioDataIn[nAudioIn].lpdata ,
                 (((PWAVEHDR) lParam)->dwBytesRecorded+m_AudioDataIn[nAudioIn].dwLength)) ;
		if (m_AudioDataIn[nAudioIn].lpdata == NULL)
		{//...出错处理
			return ;
		}
	        CopyMemory ((m_AudioDataIn[nAudioIn].lpdata+m_AudioDataIn[nAudioIn].dwLength), 
				   ((PWAVEHDR) lParam)->lpData,
				   ((PWAVEHDR) lParam)->dwBytesRecorded) ;//(*destination,*resource,nLen);	
		m_AudioDataIn[nAudioIn].dwLength +=((PWAVEHDR) lParam)->dwBytesRecorded;        
	}
	else //把PWAVEHDR(即pBUfferi)里的数据拷贝到下一“块”中
	{
		nAudioIn = (nAudioIn+1)% InBlocks;
		m_AudioDataIn[nAudioIn].lpdata = (PBYTE)realloc
			(0,((PWAVEHDR) lParam)->dwBytesRecorded);
		CopyMemory(m_AudioDataIn[nAudioIn].lpdata,
			    ((PWAVEHDR) lParam)->lpData,
				((PWAVEHDR) lParam)->dwBytesRecorded) ;
	   m_AudioDataIn[nAudioIn].dwLength =((PWAVEHDR) lParam)->dwBytesRecorded;

	}
	// Send out a new buffer	
	waveInAddBuffer (hWaveIn, (PWAVEHDR) lParam, sizeof (WAVEHDR)) ;
	return ;	
}

（2）放音处理

void CRecTestDlg::OnMM_WOM_DONE(UINT wParam,LONG lParam)
{ //释放播放完的缓冲区，并准备新的数据  
	free(m_AudioDataOut[nAudioOut].lpdata);
	m_AudioDataOut[nAudioOut].lpdata = reinterpret_cast<PBYTE>(malloc(1));
	m_AudioDataOut[nAudioOut].dwLength = 0;
 
       nAudioOut= (nAudioOut+1)%OutBlocks;
	((PWAVEHDR)lParam)->lpData          = (LPTSTR)m_AudioDataOut[nAudioOut].lpdata ;
	((PWAVEHDR)lParam)->dwBufferLength  = m_AudioDataOut[nAudioOut].dwLength ;
   	waveOutPrepareHeader (hWaveOut,(PWAVEHDR)lParam,sizeof(WAVEHDR));
       waveOutWrite(hWaveOut,(PWAVEHDR)lParam,sizeof(WAVEHDR));
   return;
}

（三）套接字发送、接收线程
　　其实，经过刚才的讨论，现在这两个线程的运作很简单---只是循环地操作nReceive和nSend指针。首先发送（接收）声音块的长度，然后发送（接收）声音内容。注意：拿CSocket::Send(buffer,count)为例，其返回值（发送出去的字结数）只是1到count之间的某值，所以要添加检测机制，否则将出现错误，这也是socket编程必须注意的。本文是用一个循环，直到发送出去的字节总数等于“块”的长度才发送第二个数据块的信息。
例外这两个线程稍加改动即可实现多人的语音会议。

UINT Audio_Listen_Thread(LPVOID lParam)
{
	CRecTestDlg *pdlg = (CRecTestDlg*)lParam;
	CSocket m_Server;
	DWORD 	length;
	if(!m_Server.Create(4002))
		AfxMessageBox("Listen Socket create error"+pdlg->GetError(GetLastError()));
	if(!m_Server.Listen()) 
		AfxMessageBox("m_server.Listen ERROR"+pdlg->GetError(GetLastError()));
	CSocket recSo;
	if(! m_Server.Accept(recSo))
		AfxMessageBox("m_server.Accept() error"+pdlg->GetError(GetLastError()));
	m_Server.Close();	
	int ret ;
	while(1)
	{   //开始循环接收声音文件，首先接收文件长度
		ret = recSo.Receive(&length,sizeof(DWORD));		
		if(ret== SOCKET_ERROR )
			AfxMessageBox("服务器端接收声音文件长度出错，原因： "+pdlg->GetError(GetLastError()));
		if(ret!=sizeof(DWORD))
		{
			AfxMessageBox("接收文件头错误，将关闭该线程");
			recSo.Close();
			return -1;
		}//接下来开辟length长的内存空间
		pdlg->m_AudioDataOut[pdlg->nReceive].lpdata =(PBYTE)realloc (0,length);
		if (pdlg->m_AudioDataOut[pdlg->nReceive].lpdata == NULL)
		{
			AfxMessageBox("erro memory_ReceiveAudio");
			recSo.Close();
			return -1;
		}
		else//内存申请成功，可以进行循环检测接受
		{
			DWORD dwReceived = 0,dwret;
			while(length>dwReceived)
			{
				dwret = recSo.Receive((pdlg->m_AudioDataOut[pdlg->nReceive].lpdata+dwReceived),
					(length-dwReceived));
				dwReceived +=dwret;
				if(dwReceived ==length)
				{
					pdlg->m_AudioDataOut[pdlg->nReceive].dwLength = length;
					break;
				}
			}
		}//本轮声音文件接收完毕	
		pdlg->nReceive=(pdlg->nReceive+1)%OutBlocks;
	}
	recSo.Close();
	return 0;
}

UINT Audio_Send_Thread(LPVOID lParam)
{                                    
	CRecTestDlg *pdlg = (CRecTestDlg*)lParam;
	CSocket m_Client;
	m_Client.Create();
	if( m_Client.Connect("127.0.0.1",4002))
	{		
		DWORD ret, length;
		int count=0;
		while(1)//循环使用指针nSend
		{
			length =pdlg->m_AudioDataIn[pdlg->nSend].dwLength;			
			if(length !=0)
			{   //首先发送块的长度
				if(((ret = m_Client.Send(&length,sizeof(DWORD)))
				     != sizeof(DWORD))||(ret==SOCKET_ERROR))
				{   
					AfxMessageBox("声音文件头传输错误!"+pdlg->GetError(GetLastError()));
					pdlg->OnOK();
					break;	
				}//其次发送块的内容,循环检测是否发送完毕
				DWORD dwSent = 0;//已经发送掉的字节数
				while(1)//==============================发送声音数据开始
				{
					ret = m_Client.Send((pdlg->m_AudioDataIn[pdlg->nSend].lpdata+dwSent),
					                     (length-dwSent));
					if(ret==SOCKET_ERROR)//检错
					{
						AfxMessageBox("声音文件传输错误!"+pdlg->GetError(GetLastError()));
						break;			
					}
					else //发送未发送完的
					{
						dwSent += ret;
						if(dwSent ==length)//发送完毕，则释放当前“块”
						{   
							free(pdlg->m_AudioDataIn[pdlg->nSend].lpdata);
							pdlg->m_AudioDataIn[pdlg->nSend].dwLength = 0;
							break;
						}
					}	
				}  //======================================发送声音数据结束
			}
			pdlg->nSend = (pdlg->nSend +1)% InBlocks;
		}
		
	}
	else 
		AfxMessageBox("Socket连接失败"+pdlg->GetError(GetLastError()));
	m_Client.Close();
	return 0;
}

存在的问题 （1） 一旦添加声音控制waveSetGetVolume(),耳机就变成单声的，打开系统的音量控制，发现“波形”选项完全不平衡。 
（2） 声音的录入运用双缓冲技术，使得无懈可击，但是在播放时，采用双缓冲调试时未能取得成功，相反使用单缓冲却基本上能够满足一般的音效。 
（3） 可能还有尚未暴露的错误，恳请广大朋友不吝赐教。E-mail: candy0624@163.com