转自:http://www.cppblog.com/tx7do/archive/2015/06/12/145865.html#210896


将数据能够在TCP中进行传输的两种方法
1.直接拷贝struct就可以了;
2.序列化。

拷贝Struct存在的问题
1.不能应付可变长类型的数据,比如STL中的那些容器,他们的长度都是不确定的。当然,STL的容器归根到底就是一个class
2.内存对齐的问题,Windows默认的对齐是4字节,如果不去刻意关闭掉对齐的话,那么可能会多出不少没必要的字节数,有时候,这个损耗是客观的。但是如果关闭了,内存拷贝又会慢一些,内存IO相对于网络IO来说,速度是快的,略微的增加内存IO的压力来调优网络IO是可行的。

序列化是怎么序列化的?
其实很简单,就是按位拷贝。在这里,我们使用一个uint8类型的变长数组作为一个容器。假设我们这里有一个uint16类型的数据,那么我们就把它拷贝进去uint8的数组里面,那么它就占了两个元素,如果是uint32,则这个数据占了4个元素位。它的原理是非常的简单的。至于具体请参考下面代码里面的ByteBuffer::append()方法。而那些class神马的,只要我们序列化的顺序和反序列化的顺序是配对的,我们就可以按照这个顺序进行序列化和反序列化了。这个在BytBuffer里面已经默认支持了常用的几个STL容器(vector,list等)。

类型定义

TCP沾包解包(3)#if defined(_MSC_VER)
TCP沾包解包(3)    //
TCP沾包解包(3)    
// Windows/Visual C++
TCP沾包解包(3)    
//
TCP沾包解包(3)
    typedef signed __int8            int8;
TCP沾包解包(3)    typedef unsigned __int8            uint8;
TCP沾包解包(3)    typedef signed __int16            int16;
TCP沾包解包(3)    typedef unsigned __int16        uint16;
TCP沾包解包(3)    typedef signed __int32            int32;
TCP沾包解包(3)    typedef unsigned __int32        uint32;
TCP沾包解包(3)    typedef signed __int64            int64;
TCP沾包解包(3)    typedef unsigned __int64        uint64;
TCP沾包解包(3)#endif
有的类型的长度会因硬件或者操作系统而异,如果直接使用c++关键字中的类型定义可能会出现问题。因此,需要自己定义以上这样的类型。利用宏去适配各个操作系统或者硬件平台。

ByteBuffer的代码
#endif


如何利用ByteBuffer序列化和反序列化
假设我们要序列化std::string的数据,那么我们这样做:
TCP沾包解包(3)std::string str;
TCP沾包解包(3)ByteBuffer buf;
TCP沾包解包(3)buf << str;
那么,如何将这个str反序列化出来呢?这样做:
TCP沾包解包(3)std::string str;
TCP沾包解包(3)ByteBuffer buf;
TCP沾包解包(3)buf >> str;
So Easy!是吧。具体在TCP收发包的实际场景中怎样做,我也不多废话,请看下面下载提供的代码便是了。


在实用下细节上的一些区别
通常情况下,一个协议的数据集会定义为一个struct,然后重载其<<和>>算符用于序列化和反序列化。这个如果仅仅是在C++下倒还好,但如若放置在混合语言编程的情况下,这可能就不行了,很多语言是不支持算符重载的。如若纯逻辑都在lua或者python神马里面做,我们只能为每个基本类型写一个read和write的方法:readInt8,readInt16,,readString,writeInt8,writeInt16,writeString等等。然后在每个协议处理方法里面按照顺序逐个的处理协议数据集的数据,这样是很容易出问题的,却也是没有办法的办法了。

Google Protocol Buffer(ProtoBuf)
在开源工具里面,不得不提到的就是它了,它很适合于混合语言的情况下使用。它自己有一套自己的数据描述语言,数据序列化的描述都写在.proto。只需要写一次.proto文件,便可以在多语言里面使用了该协议了。比如,我曾经做过一个VC+Flash AS3的项目,就是用的它。如果没有它,网络协议我必须在c++里面定义一次,flash里面再定义一次,那可真真是麻烦死了,麻烦倒还是小事情,如果两边的定义不同步的话,序列化或者反序列化就会发生错误,那可就糟糕了。
如果有多语言的需求,最好就是使用像ProtoBuf这样的解决方案。当然,如果没有跨语言的需求,还是尽量简单为好,比如上面的ByteBuffer,毕竟简单的东西自己可以比较轻松的掌控。
主页地址:http://code.google.com/p/protobuf/


代码下载testByteBuffer.rar
 


EDIT:
time_t解序列化写错了,参数应该是一个传出值,为一个引用,但是我把引用符给忘记了。特此订正!
TCP沾包解包(3) ByteBuffer& operator>>(time_t& value)
 }


相关文章: