JAVA Remote Procedure Call

执行器(invoker):对于客户端:主要负责服务调用的编码,调用请求发送和等待结果返回;对于服务方:负责处理调用逻辑并返回调用结果;

JAVA Remote Procedure Call

JAVA Remote Procedure Call

协议管理(protocol):协议管理组件,负责整个 rpc 通信协议的编/解码;

连接端口(connector):负责维持客户方和服务方的长连接通道;

后台处理(processor):负责整个调用服务中的管理调度,包括线程池,分发,异常处理等;

连接通道(channel):客户端和服务器端的数据传输通道。

具体到 java 平台来说,其中的3,4通常使用动态代理实现,5,6,7,8使用 nio 或者一些高性能 nio 框架,如 mina,netty 实现。最简单的 rpc java 实现在进一步拆解了组件并划分了职责之后,这里以一个最简单 java rpc 框架实现为例,对 rpc 具体逻辑进行分析。

rpc 框架服务发布代码:服务端发布服务的代码如上,首先校验传入的端口和服务是否合法,然后开启一个 socket 监听,这儿为了简便,没有采用 nio 方式,同时直接采用 java 的序列化方式,将传入的数据通过反射取出调用的方法和参数,本地执行后将运行结果通过 socket 套接字返回给客户端。

rpc 框架服务调用代码:框架中客户端调用的代码中,首先校验对应的端口和主机是否合法,然后通过动态代理生成一个代理对象,在代理对象的方法中,拦截调用,通过建立 socket 连接,将方法和参数传递到远端执行并获取远程执行返回结果。

rpc 调用测试:如上图所示,服务器端发布一个接口服务 helloservice,客户端成功通过 rpc 调用。

思 考 篇自定义 rpc 协议协议头

在上面的示例程序当中,我们仅仅是完成了一个基本的远程调用,并没有实现 rpc 框架中的很多组件功能,从最简单的代码版本中我们可以发现,发起一个 rpc 调用,需要传输的最基本数据如下:

接口方法:包括接口的名字和相应的方法名字;

方法参数:包括参数的类型和取值;

附件参数,包括调用接口版本,接口超时时间等等。

因此,如果要自定义协议实现 rpc,我们必须再协议的消息体中包含这部分数据,另外,我们需要定义一些协议元数据,这些元数据通常放在协议头中,和包含必要参数的协议体一期组成了自定义消息。

元数据通常会包含以下字段,大部分字段只需要1-2位:

magic: 魔数,方便协议解码

header_size: 协议头大小,便于解码,同时可用用于处理tcp粘包问题

id :消息 id,用来标示这次调用

version: 接口版本

type:消息类型,可用包括普通调用消息,心跳,控制消息

status:消息状态,是否首次处理或者已经处理

body_size: 消息体长度

serialize_type:消息体序列化类型

body:具体消息

具体消息

消息内容在网络上传输需要对其进行编码,这个编码的过程就是序列化过程,显然,对于网络传输的数据,在能够保证信息足够解码的情况下,序列化的大小越小,传输的开销就越小,效率就越高,目前 java 平台常用的序列化方式有:xml,json ,binary(包括 thrift; hession; kryo 等)。

在 rpc 调用中我们推荐使用二进制方式进行序列化,在大部分的测试中,二进制方式

并发控制:当多个请求并发处理的时候,如何管理和控制线程池和超时等待时间;

版本隔离:当服务有多个版本的时候,如何让不同的调用者能够调用正确的服务;

服务路由:当服务提供者有多台机器的时候,如何提高系统负载均衡,路由到正确的服务端;

服务降级:当多个服务重要性有不同的时候,如果保证核心业务的稳定性,适当的降低非核心业务优先级;

服务监控和报警:服务出现异常情况时候,运维和对应的系统负责人能够第一时间得到告警和错误信息。

以上的思考大部分要结合运维层面一起考虑,但是 rpc 框架本身也要提供足够的支持才能保证它足够的健壮性。需要注意的一些地方虽然 rpc 有足够多的优点让你去使用,但是当真正转向服务化的时候,依然有很多需要考虑的地方:

网络问题:本地调用无需考虑是否能够执行问题,网络调用可能会因为各种外部网络环境,端口拦截,ip 受限等可能情况导致无法成功执行。所以 rpc 的服务端通常要考虑幂等性和容错性,接口需要较强的鲁棒性设计。

异常处理:rpc 和本地服务最大的不同就是 rpc 服务存在分布式一致性问题,当服务没有调用成功情况下,本地和远程的服务可能处于一个不一致的状态,如何进行异常处理和事物的回滚机制也是一个需要考虑的问题,是需要保障强一致性和最终一致性通常取决于具体的业务需求。

由于网络原因,rpc 服务通常会被本地服务处理慢一个数量级,在比较轻量级的业务和并发量很小的情况下,并不需要 rpc 服务,引入 rpc 服务后,无论是系统的调试,还是线上问题分析都会变得非常复杂,是否引入也需要权衡相关利弊。

在传统的开发模式中,我们通常将系统的各个服务部署在单台机器,随着服务的扩展,这种方式已经完全无法满足系统大规模的扩展需要,分布式系统由此诞生,在分布式系统中,最重要就是各个服务之间的 rpc 调用。

rpc 全称 remote procedure call——远程过程调用,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的方式。简单一点就是:通过一定协议和方法使得调用远程计算机上的服务,就像调用本地服务一样。

通常来说,rpc 的实现方式有很多,可以基于常见的 http 协议,也可以在tcp上层封装自定义协议,常见的 web service 就是基于 http 协议的 rpc,http 协议的优点是具有良好的跨平台性,特别适合异构系统较多的公司,但是由于 http 报头较为冗长,性能较差,基于 tcp 协议的 rpc 可以建立长连接,速度和效率明显,但是难度和复杂程度很高。

rpc 的诞生让构建分布式应用更容易,极大的扩大系统的可扩展性,容错性。为复杂业务逻辑的系统进行服务化改造和高可用性升级提供了可能。rpc 调用分类rpc 调用的分类方式有很多种。

从通信协议层面可以分为:

基于 http 协议的 rpc;

基于二进制协议的 rpc;

基于 tcp 协议的 rpc。

从是否跨平台可分为:

单语言 rpc,如 rmi, remoting;

跨平台 rpc,如 google protobuffer, restful json,http xml。

从调用过程来看,可以分为同步通信rpc和异步通信rpc:

同步 rpc:指的是客户端发起调用后,必须等待调用执行完成并返回结果;

异步 rpc:指客户方调用后不关心执行结果返回,如果客户端需要结果,可用通过提供异步 callback 回调获取返回信息。大部分 rpc 框架都同时支持这两种方式的调用。rpc

对于客户端来说,服务调用完全透明,像调用本地服务一样调用远程方法,客户端调用服务时候通过一个远程连接和服务端建立通道,并通过相应的协议进行编码,将调用的方法和相关参数发送给服务方。(原创 程序猿的内心独白)

  • JAVA Remote Procedure Call已关闭评论
    A+
发布日期:2019年07月02日  所属分类:新闻动态