Thrift之Protocol源码分析
2015-04-09来源:易贤网

之前写过两篇关于 Thrift 的相关文章。

Thrift源码剖析

Thrift异步IO服务器源码分析

也算是对Thrift比较熟悉,不过对 Thrift 里面的 Protocol 部分还是黑盒使用。 虽然大概能猜到具体实现方式,但是还是忍不住花了一点点时间把具体代码实现翻出来看看。 主要是为了满足一下好奇心。

简单搞了一个Thrift的描述文件Insight.thrift作为例子。

struct Person {

1: string name,

2: i32 age,

3: optional string address,

}

service Insight {

Person Hello(1: Person person),

Person Hi(1: Person p1, 2: Person p2),

}

然后通过 毕竟Thrift其实就是干RPC的活,所以看源码就按着RPC远程调用的顺序来看就行。

从Hello函数调用开始,InsightClient::Hello 可以看出, 在每次RPC调用的时候,会先将函数名通过writeMessageBegin("Hello", ::apache::thrift::protocol::T_CALL, cseqid) 先发送过去。 这个过程的序列化协议很简单,直接就是传输的函数名字符串。 然后再发送参数。 发送参数的时候,会将所有参数作为一个 struct 发送 InsightHellopargs,

所以协议的序列化过程主要都是体现在 struct 的序列化上面。 比如像Hi函数的参数序列化过程:

uint32_t Insight_Hi_pargs::write(::apache::thrift::protocol::TProtocol* oprot) const {

uint32_t xfer = 0;

xfer += oprot->writeStructBegin("Insight_Hi_pargs");

xfer += oprot->writeFieldBegin("p1", ::apache::thrift::protocol::T_STRUCT, 1);

xfer += (*(this->p1)).write(oprot);

xfer += oprot->writeFieldEnd();

xfer += oprot->writeFieldBegin("p2", ::apache::thrift::protocol::T_STRUCT, 2);

xfer += (*(this->p2)).write(oprot);

xfer += oprot->writeFieldEnd();

xfer += oprot->writeFieldStop();

xfer += oprot->writeStructEnd();

return xfer;

}

整个对象的序列化过程主要是依赖了接口 TProtocol 的函数。

对于实现 TProtocol 接口的序列化实现主要是以下三种(在thrift-0.9.0/lib/cpp/src/thrift/protocol里):

TBinaryProtocol

TCompactProtocol

TJSONProtocol

要了解协议序列化过程主要看一下 TBinaryProtocol 和 TCompactProtocol 就够了。

主要是如下几个关键点:

其实 writeStructStruct 和 writeStructEnd 啥屁事也不用做。

其实 writeFieldBegin 只有后两个参数有用,第二个参数是类型,第三个参数是ID, 因为光靠这两者就可以在反序列化(读取解析)的时候知道是哪个成员了。

struct write 的过程其实是个递归的过程,也就是在write函数中, 会递归的调用结构体本身每个成员的write函数。

TCompactProtocol 和 TBinaryProtocol 的区别主要是, TCompactProtocol 对整数类型使用了 ZigZag 压缩算法,比如 i32 类型的整数本来是4个字节, 可以压缩成 1~5 字节不等。而 i64类型的整数本来是8个字节。可以压缩成 1~10 字节不等。

更多信息请查看IT技术专栏

推荐信息