JAVA Remote Procedure Call |电子通-应用新知，新电子的助推者电子通

执行器（invoker）：对于客户端：主要负责服务调用的编码，调用请求发送和等待结果返回；对于服务方：负责处理调用逻辑并返回调用结果；

协议管理（protocol）：协议管理组件，负责整个 rpc 通信协议的编/解码；

连接端口（connector）：负责维持客户方和服务方的长连接通道；

后台处理（processor）：负责整个调用服务中的管理调度，包括线程池，分发，异常处理等；

连接通道（channel）：客户端和服务器端的数据传输通道。

具体到 java 平台来说，其中的3,4通常使用动态代理实现，5,6,7,8使用 nio 或者一些高性能 nio 框架，如 mina,netty 实现。最简单的 rpc java 实现在进一步拆解了组件并划分了职责之后，这里以一个最简单 java rpc 框架实现为例，对 rpc 具体逻辑进行分析。

rpc 框架服务发布代码：服务端发布服务的代码如上，首先校验传入的端口和服务是否合法，然后开启一个 socket 监听，这儿为了简便，没有采用 nio 方式，同时直接采用 java 的序列化方式，将传入的数据通过反射取出调用的方法和参数，本地执行后将运行结果通过 socket 套接字返回给客户端。

rpc 框架服务调用代码：框架中客户端调用的代码中，首先校验对应的端口和主机是否合法，然后通过动态代理生成一个代理对象，在代理对象的方法中，拦截调用，通过建立 socket 连接，将方法和参数传递到远端执行并获取远程执行返回结果。

rpc 调用测试：如上图所示，服务器端发布一个接口服务 helloservice，客户端成功通过 rpc 调用。

思考篇自定义 rpc 协议协议头

在上面的示例程序当中，我们仅仅是完成了一个基本的远程调用，并没有实现 rpc 框架中的很多组件功能，从最简单的代码版本中我们可以发现，发起一个 rpc 调用，需要传输的最基本数据如下：

接口方法：包括接口的名字和相应的方法名字；

方法参数：包括参数的类型和取值；

附件参数，包括调用接口版本，接口超时时间等等。

因此，如果要自定义协议实现 rpc，我们必须再协议的消息体中包含这部分数据，另外，我们需要定义一些协议元数据，这些元数据通常放在协议头中，和包含必要参数的协议体一期组成了自定义消息。

元数据通常会包含以下字段，大部分字段只需要1-2位：

magic: 魔数，方便协议解码

header_size: 协议头大小，便于解码，同时可用用于处理tcp粘包问题

id :消息 id，用来标示这次调用

version: 接口版本

type:消息类型，可用包括普通调用消息，心跳，控制消息

status:消息状态,是否首次处理或者已经处理

body_size: 消息体长度

serialize_type:消息体序列化类型

body：具体消息

具体消息

消息内容在网络上传输需要对其进行编码，这个编码的过程就是序列化过程，显然，对于网络传输的数据，在能够保证信息足够解码的情况下，序列化的大小越小，传输的开销就越小，效率就越高，目前 java 平台常用的序列化方式有：xml，json ，binary(包括 thrift; hession; kryo 等)。

在 rpc 调用中我们推荐使用二进制方式进行序列化，在大部分的测试中，二进制方式

并发控制：当多个请求并发处理的时候，如何管理和控制线程池和超时等待时间；

版本隔离：当服务有多个版本的时候，如何让不同的调用者能够调用正确的服务；

服务路由：当服务提供者有多台机器的时候，如何提高系统负载均衡，路由到正确的服务端；

服务降级：当多个服务重要性有不同的时候，如果保证核心业务的稳定性，适当的降低非核心业务优先级；

服务监控和报警：服务出现异常情况时候，运维和对应的系统负责人能够第一时间得到告警和错误信息。

以上的思考大部分要结合运维层面一起考虑，但是 rpc 框架本身也要提供足够的支持才能保证它足够的健壮性。需要注意的一些地方虽然 rpc 有足够多的优点让你去使用，但是当真正转向服务化的时候，依然有很多需要考虑的地方：

网络问题：本地调用无需考虑是否能够执行问题，网络调用可能会因为各种外部网络环境，端口拦截，ip 受限等可能情况导致无法成功执行。所以 rpc 的服务端通常要考虑幂等性和容错性，接口需要较强的鲁棒性设计。

异常处理：rpc 和本地服务最大的不同就是 rpc 服务存在分布式一致性问题，当服务没有调用成功情况下，本地和远程的服务可能处于一个不一致的状态，如何进行异常处理和事物的回滚机制也是一个需要考虑的问题，是需要保障强一致性和最终一致性通常取决于具体的业务需求。

由于网络原因，rpc 服务通常会被本地服务处理慢一个数量级，在比较轻量级的业务和并发量很小的情况下，并不需要 rpc 服务，引入 rpc 服务后，无论是系统的调试，还是线上问题分析都会变得非常复杂，是否引入也需要权衡相关利弊。

在传统的开发模式中，我们通常将系统的各个服务部署在单台机器，随着服务的扩展，这种方式已经完全无法满足系统大规模的扩展需要，分布式系统由此诞生，在分布式系统中，最重要就是各个服务之间的 rpc 调用。

rpc 全称 remote procedure call——远程过程调用，它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的方式。简单一点就是：通过一定协议和方法使得调用远程计算机上的服务，就像调用本地服务一样。

通常来说，rpc 的实现方式有很多，可以基于常见的 http 协议，也可以在tcp上层封装自定义协议，常见的 web service 就是基于 http 协议的 rpc，http 协议的优点是具有良好的跨平台性，特别适合异构系统较多的公司，但是由于 http 报头较为冗长，性能较差，基于 tcp 协议的 rpc 可以建立长连接，速度和效率明显，但是难度和复杂程度很高。

rpc 的诞生让构建分布式应用更容易，极大的扩大系统的可扩展性，容错性。为复杂业务逻辑的系统进行服务化改造和高可用性升级提供了可能。rpc 调用分类rpc 调用的分类方式有很多种。

从通信协议层面可以分为：

基于 http 协议的 rpc；

基于二进制协议的 rpc；

基于 tcp 协议的 rpc。

从是否跨平台可分为：

单语言 rpc，如 rmi, remoting；

跨平台 rpc，如 google protobuffer, restful json，http xml。

从调用过程来看，可以分为同步通信rpc和异步通信rpc：

同步 rpc：指的是客户端发起调用后，必须等待调用执行完成并返回结果；

异步 rpc：指客户方调用后不关心执行结果返回，如果客户端需要结果，可用通过提供异步 callback 回调获取返回信息。大部分 rpc 框架都同时支持这两种方式的调用。rpc

对于客户端来说，服务调用完全透明，像调用本地服务一样调用远程方法，客户端调用服务时候通过一个远程连接和服务端建立通道，并通过相应的协议进行编码，将调用的方法和相关参数发送给服务方。（原创程序猿的内心独白）

微信