请问：RTSP服务器端是不是已经把音视频解析成了帧_多媒体设计

请教：RTSP服务器端是不是已经把音视频解析成了帧？
最近在看一些关于RTSP方面的资料，很疑惑：我在想，RTSP服务器是不是已经把音视频数据解析成了一帧一帧的数据，然后再打成RTP包进行传输，这样，在客户端只需要把包解开，就得到了一帧一帧的音视频数据？之所以有这样的疑惑，是因为在网上看到如下代码：
class RTPFrame
{
public:
RTPFrame(const unsigned char * frame, int frameLen) // 数据和长度
{
_frame = (unsigned char*) frame;
_frameLen = frameLen;
};

RTPFrame(unsigned char * frame, int frameLen, unsigned char payloadType) // 数据、长度和有效载荷类型
{
_frame = frame;
_frameLen = frameLen;
if (_frameLen > 0)
_frame [0] = 0x80; // 版本为2
SetPayloadType(payloadType); //
}

unsigned GetPayloadSize() const
{
return (_frameLen - GetHeaderSize());
}

void SetPayloadSize(int size)
{
_frameLen = size + GetHeaderSize(); // length = headerSize + PayloadSize
}

int GetFrameLen () const
{
return (_frameLen);
}

unsigned char * GetPayloadPtr() const
{
return (_frame + GetHeaderSize());// easy
}

int GetHeaderSize() const
{
int size;
size = 12; // 头长度
if (_frameLen < 12)
{
return 0;
}
size += (_frame[0] & 0x0f) * 4; // CC记录CSRC的个数，每个是4个字节
if (!(_frame[0] & 0x10)) // 看扩展位
return size;
if ((size + 4) < _frameLen) // 扩展位
return (size + 4 + (_frame[size + 2] << 8) + _frame[size + 3]);
return 0;
}

bool GetMarker() const // 是否有标志位
{
if (_frameLen < 2)
return false;
return (_frame[1] & 0x80); // 标志位
}

unsigned GetSequenceNumber() const // _frame[2] and _frame[3]
{
if (_frameLen < 4)
{
return 0;
}
return (_frame[2] << 8) + _frame[3];// or (_frame[2] << 8 ) | _frame[3]
}

void SetMarker(bool set) // _frame[1]: 1bit
{
if (_frameLen < 2)
return;
_frame[1] = _frame[1] & 0x7f;
if (set) _frame[1] = _frame[1] | 0x80;
}

void SetPayloadType(unsigned char type)
{
if (_frameLen < 2)
return;
_frame[1] = _frame [1] & 0x80; // 先把payload清空
_frame[1] = _frame [1] | (type & 0x7f); // set
}

unsigned char GetPayloadType() const
{
if (_frameLen < 1)
return 0xff;
return _frame[1] & 0x7f;
}

unsigned long GetTimestamp() const // _frame[4-7]
{
if (_frameLen < 8)
return 0;
return ((_frame[4] << 24) + (_frame[5] << 16) + (_frame[6] << 8) + _frame[7]); // get:((_frame[4] << 24) | (_frame[5] << 16) | (_frame[6] << 8) | _frame[7])
}

void SetTimestamp(unsigned long timestamp)
{
if (_frameLen < 8)
return;
_frame[4] = (unsigned char) ((timestamp >> 24) & 0xff); // set
_frame[5] = (unsigned char) ((timestamp >> 16) & 0xff);
_frame[6] = (unsigned char) ((timestamp >> 8) & 0xff);
_frame[7] = (unsigned char) (timestamp & 0xff);
};

protected:
unsigned char* _frame;
int _frameLen;
};
简单的说，我并不明白这里的RTPFrame和音视频帧(frame)是不是有某些联系。向大家请教。

------解决方案--------------------------------------------------------
个人理解：
文件传输时应该是一个个的字节数据包（包含：头、尾等信息），并不一定是完整的帧，客户端通常解析数据包再进行组合转换成帧