当前位置: 代码迷 >> 多媒体设计 >> 请问:RTSP服务器端是不是已经把音视频解析成了帧
  详细解决方案

请问:RTSP服务器端是不是已经把音视频解析成了帧

热度:1786   发布时间:2013-02-26 00:00:00.0
请教:RTSP服务器端是不是已经把音视频解析成了帧?
最近在看一些关于RTSP方面的资料,很疑惑:我在想,RTSP服务器是不是已经把音视频数据解析成了一帧一帧的数据,然后再打成RTP包进行传输,这样,在客户端只需要把包解开,就得到了一帧一帧的音视频数据?之所以有这样的疑惑,是因为在网上看到如下代码:
class RTPFrame 
{
public:
RTPFrame(const unsigned char * frame, int frameLen) // 数据和长度
{
_frame = (unsigned char*) frame;
_frameLen = frameLen;
};

RTPFrame(unsigned char * frame, int frameLen, unsigned char payloadType) // 数据、长度和有效载荷类型
{
_frame = frame;
_frameLen = frameLen;
if (_frameLen > 0)
_frame [0] = 0x80; // 版本为2
SetPayloadType(payloadType); // 
}

unsigned GetPayloadSize() const
{
return (_frameLen - GetHeaderSize()); 
}

void SetPayloadSize(int size) 
{
_frameLen = size + GetHeaderSize(); // length = headerSize + PayloadSize
}

int GetFrameLen () const 
{
return (_frameLen);
}

unsigned char * GetPayloadPtr() const 
{
return (_frame + GetHeaderSize());// easy
}

int GetHeaderSize() const 
{
int size;
size = 12; // 头长度
if (_frameLen < 12) 
{
return 0;
}
size += (_frame[0] & 0x0f) * 4; // CC记录CSRC的个数,每个是4个字节
if (!(_frame[0] & 0x10)) // 看扩展位
return size;
if ((size + 4) < _frameLen) // 扩展位
return (size + 4 + (_frame[size + 2] << 8) + _frame[size + 3]);
return 0;
}

bool GetMarker() const // 是否有标志位
{
if (_frameLen < 2) 
return false;
return (_frame[1] & 0x80); // 标志位
}

unsigned GetSequenceNumber() const // _frame[2] and _frame[3]
{
if (_frameLen < 4)
{
return 0;
}
return (_frame[2] << 8) + _frame[3];// or (_frame[2] << 8 ) | _frame[3]
}

void SetMarker(bool set) // _frame[1]: 1bit
{
if (_frameLen < 2) 
return;
_frame[1] = _frame[1] & 0x7f;
if (set) _frame[1] = _frame[1] | 0x80;
}

void SetPayloadType(unsigned char type) 
{
if (_frameLen < 2) 
return;
_frame[1] = _frame [1] & 0x80; // 先把payload清空
_frame[1] = _frame [1] | (type & 0x7f); // set
}

unsigned char GetPayloadType() const
{
if (_frameLen < 1)
return 0xff;
return _frame[1] & 0x7f;
}

unsigned long GetTimestamp() const // _frame[4-7]
{
if (_frameLen < 8)
return 0;
return ((_frame[4] << 24) + (_frame[5] << 16) + (_frame[6] << 8) + _frame[7]); // get:((_frame[4] << 24) | (_frame[5] << 16) | (_frame[6] << 8) | _frame[7])
}

void SetTimestamp(unsigned long timestamp) 
{
if (_frameLen < 8)
return;
_frame[4] = (unsigned char) ((timestamp >> 24) & 0xff); // set
_frame[5] = (unsigned char) ((timestamp >> 16) & 0xff);
_frame[6] = (unsigned char) ((timestamp >> 8) & 0xff);
_frame[7] = (unsigned char) (timestamp & 0xff);
};

protected:
unsigned char* _frame;
int _frameLen;
};
简单的说,我并不明白这里的RTPFrame和音视频帧(frame)是不是有某些联系。向大家请教。

------解决方案--------------------------------------------------------
个人理解:
文件传输时应该是一个个的字节数据包(包含:头、尾等信息),并不一定是完整的帧,客户端通常解析数据包再进行组合转换成帧
  相关解决方案