SIPSIP(Session IniTIaTIon Protocol)是一个应用层的信令控制协议。用于创建、修改和释放一个或多个参与者的会话。这些会话可以是Internet多媒体会议 、IP电话或多媒体分发。会话的参与者可以通过组播(mulTIcast)、网状单播(unicast)或两者的混合体进行通信。
SIP与负责语音质量的资源预留协议(RSVP) 互操作。它还与若干个其他协议进行协作,包括负责定位的轻型目录访问协议(LDAP)、负责身份验证的远程身份验证拨入用户服务 (RADIUS) 以及负责实时传输的 RTP 等多个协议。
SIP 的一个重要特点是它不定义要建立的会话的类型,而只定义应该如何管理会话。有了这种灵活性,也就意味着SIP可以用于众多应用和服务中,包括交互式游戏、音乐和视频点播以及语音、视频和 Web 会议。SIP消息是基于文本的,因而易于读取和调试。新服务的编程更加简单,对于设计人员而言更加直观。SIP如同电子邮件客户机一样重用 MIME 类型描述,因此与会话相关的应用程序可以自动启动。SIP 重用几个现有的比较成熟的 Internet 服务和协议,如 DNS、RTP、RSVP 等。不必再引入新服务对 SIP 基础设施提供支持,因为该基础设施很多部分已经到位或现成可用。
对 SIP 的扩充易于定义,可由服务提供商在新的应用中添加,不会损坏网络。网络中基于 SIP 的旧设备不会妨碍基于 SIP 的新服务。例如,如果旧 SIP 实施不支持新的 SIP 应用所用的方法/标头,则会将其忽略。
SIP 独立于传输层。因此,底层传输可以是采用 ATM 的 IP。SIP 使用用户数据报协议(UDP) 以及传输控制协议(TCP),将独立于底层基础设施的用户灵活地连接起来。SIP 支持多设备功能调整和协商。如果服务或会话启动了视频和语音,则仍然可以将语音传输到不支持视频的设备,也可以使用其他设备功能,如单向视频流传输功能。
通信提供商及其合作伙伴和用户越来越渴求新一代基于 IP 的服务。如今有了 SIP(The Session IniTIation Protocol 会话启动协议),一解燃眉之急。SIP 是不到十年前在计算机科学实验室诞生的一个想法。它是第一个适合各种媒体内容而实现多用户会话的协议,如今已成了 Internet 工程任务组 (IETF) 的规范。
SIP协议解析与实现
SIP协议是一个基于应用层的会话控制协议。它可以创建、修改、终止多媒体会话(会议),也可以邀请参与者加入到一个现有的会话。
因为SIP是一个基于应用层的协议,所以它不是一套完整的通讯系统方案,它需要和其它的方案或者协议结合起来实现整套系统。例如,实时传输协议(RTP)(RFC1889)用来传输音视频等实时的流媒体数据。实时流协议(RTSP)(RFC2326)用来控制媒体流的传递。媒体网关控制协议(MEGACO)(RFC3015)用来控制PSTN网关。
由此可见,SIP协议应该用来组合其它协议,从而实现完整的服务。但是,SIP基础的功能和操作不依赖于其它协议。
SIP( Session Initiation Protocol ,RFC 3261)是由 IETF (国际互联网标准制定组织)制定的面向 Internet 会议和电话的信令协议。SIP是一个应用层的协议,可以建立,修改或者中止多媒体会话或者呼叫。它是一个基于ASCII的端到端的协议,它实际上是在因特网上提供“约会”服务。用来实现VoIP的开放协议,最常用的有三种,SIP、MGCP(Media Gateway Control Protocol)和H.323。
SIP协议是专门为 IP 电话,尤其是结合 Internet 设计的协议,同传统的 H.323 协议相比,SIP 拥有明显的优越性:优异的可扩展性--大大提高了系统的处理能力;与 Internet 紧密结合--使通讯更加轻松便捷的;卓越的开放性--不仅能够对手机、 PDA 等移动设备提供良好的支持,对于在线即时交流、语音和视频数据传输等多媒体应用也能够很好地完成。
SIP协议的特性和优势
与SIP兼容的协议
SIP协议可以单独地工作,也可以与下面的协议一起工作。
二第一个例子
下面引用RFC3261的例子来说明sip的基本功能,包括:定位终端,发送通讯请求,协商会话参数,建立会话和撤销建立的会话。图1显示了用户Alice和Bob使用SIP交换信息的一个典型的例子(每一个消息用字母F和一个数字来标号,标号的前面有一个简短的消息类型说明)。在这个例子中,Alice使用一个在她的PC机中的SIP应用程序呼叫Bob,Bob使用他的SIP电话,这个SIP电话登录了互联网。同时,请注意两个SIP代理服务器在Alice和Bob的会话的建立中起到的作用。
Alice呼叫Bob是使用他的SIP标识符。SIP标识符是一种URI(Uniform Resource Identifier),称之为SIP URI。SIP URI格式很象email地址,包含一个用户名和一个主机名,如:sip:bob@biloxi.com。这里biloxi.com是Bob的SIP服务提供者的域名。Alice的SIP URI是:sip:alice@atlanta.com。SIP也支持安全URI,叫做SIPS URI,例如,sips:bob@biloxi.com。一个向SIPS URI的呼叫使用加密传输(也就是TLS)来携带从呼叫者到被呼叫者所有的SIP消息。
SIP是一个与HTTP协议很像的,请求/应答式的事务模型。每一个事务最少由一个要完成特定方法或功能的请求,和服务器端的一个应答组成。在这个例子中,这个事务从Alice的软电话发送一个INVITE请求到Bob的SIP URI开始。INVITE是一个SIP消息,它表示请求者Alice想与Bob通话。INVITE请求包含一些头域。头域被称为属性,可以提供关于这个消息的额外信息。关于头域我们一会儿将会详细说明它们。图1中的INVITE信息(F1)可能像这样:
第一行文本是这个请求的方法名(INVITE)。后面的行是多个头域。这里只列出了最少需要的头域。先在这里对这些头域做一个简要的介绍:
Via头域包含Alice希望收到对于这个请求的应答的地址。也就是她告诉请求的接收者,应答应该发送到 pc33.atlanta.com。后面的branch参数是这个事务的标识符。
To头域包含一个显示名(Bob)和一个SIP URI或者SIPS URI,这里是使用的SIP URI(sip:bob@biloxi.com)。这个SIP URI就是这个请求要发送的目标。
From头域也包含一个显示名(Alice)和一个SIP URI或者SIPS URI,这里是使用的SIP
URI(sip:alice@atlanta.com)来指出请求的发起人。这个头域还包含了一个tag参数,这个参数包含了一个随机字符串(1928301774),这个字符串的数字会被软电话自动增加,它主要起到鉴别的作用,后面还会说明它。
Call-ID头域包含一个全局唯一标识符来标识这次呼叫。这个标识符使用一个随即字符串和软电话所在的主机名(或者IP地址)一起生成。这样,To头域、From头域和Call-ID这三个头域就可以唯一的确定了Alice和Bob的这条点对点的通信关系,并且将这个通信关系交给一个对话(dialog)来处理了。
Cseq头域(命令序列)包含一个整数和一个方法名字。在这个对话中每一个新的请求都会增加这个整数的值,保证这个数值是有序的。
Contact头域包含一个SIP URI或者SIPS URI指出一个能够接触到Alice的直接路由,一般这个SIP URI由用户名和一个完全限定域名(FQDN)构成。因为许多终端系统没有注册域名,所以也可以使用IP地址代替FQDN。Via头域向对方指出了这个请求的应答应该发送到哪里,而Contact头域向对方指出了将来的请求应该发送到哪里。
Max-Forwards头域限制了在这个请求传送到目的地的时候最多可以有多少跳。它包含一个整数,在每一跳这个整数都会被减少。
Content-Type头域描述消息体的类型(在这个例子里消息体采用了SDP描述,但是消息体内容没有给出)。
Content-Length头域指出了消息体的字节数。
在后面我们将完整的介绍SIP头域(RFC3261第20节)。
在会话中像媒体类型、编码方式、采样率等信息都不使用SIP描述,而是在消息体中使用其它会话描述协议的格式。这个例子中采用了SDP描述(RFC2327)。
软电话不知道Bob或者拥有biloxi.com域名的SIP服务器,它将INVITE请求发送给为Alice提供服务的域名为atlanta.com的SIP服务器。关于Alice如何获得atlanta.com SIP服务器的地址,可以使用由Alice的软电话指定,或者使用DHCP探测到等方式。
atlanta.com SIP服务器是一个SIP代理服务器。一个代理服务器接收SIP请求,为请求的发送者转发请求。在这个例子中,代理服务器接收到INVITE请求后发送一个100应答(Trying)给Alice的软电话。100应答(Trying)指出这个INVITE请求已经被代理服务器接收到,并且已被经进一步向目的地路由。
SIP中的应答使用3位数字表示,每一个编号都表示一个描述短语。这个100应答(Trying)也同样包含和INVITE请求一样的To、From、Call-ID、CSeq和Via以及branch参数,这样可以使Alice的软电话知道这个应答是对应发送的INVITE请求的。atlanta.com代理服务器定位出biloxi.com代理服务器(这可能需要通过域名解析服务器(DNS)等实现,后面还会详细讲解)获得了它的IP地址,并且准备把INVITE请求转发给biloxi.com代理服务器。在转发请求之前,atlanta.com代理服务器增加了一个额外的Via头域,这个Via头域包含自己的地址(这时候这个INVITE请求的第一个Via头域包含Alice的软电话的地址)。
biloxi.com代理服务器接收到这个INVITE请求,并且也发送一个100(Trying)应答给atlanta.com代理服务器指出它已经接收到这个INVITE请求,并正在处理这个请求。biloxi.com代理服务器知道Bob的IP地址(这可能需要定位服务),它又在这个INVITE请求中加入了一个新的Via头域,值为自己的地址,然后它把这个INVITE请求发送给Bob的SIP电话。
Bob的SIP电话接收到这个INVITE请求,发送一个180(Ringing)应答,同时使用铃声通知Bob有一个来自Alice的呼叫,让Bob决定是否接听。这个180(Ringing)应答反向经过这两个代理服务器被发送到Alice。每一个代理服务器使用Via头域决定向哪里发送这个应答,并且把移除它自己添加的Via头域。这样,虽然只有初始的INVITE请求发送的时候使用了DNS服务和定位服务,而这个180(Ringing)应答没有使用,同时代理服务器也不需要记录整个通讯的状态,但是这个应答还是能够成功的发送给请求的发送者Alice。
当alice的软电话接收到180(Ringing)应答后,它将这个消息告诉给Alice,也许使用一个声音(彩铃)或者在Alice的屏幕上显示一个消息。
在这个例子中,Bob决定接听电话,当他按下接听按钮时,他的SIP电话发送200(OK)应答表示接受了这个呼叫。这个200(OK)应答包含一个消息体,消息体使用SDP描述Bob准备和Alice建立的会话的媒体类型等信息。这样,Alice和Bob交换了一次SIP信息:Alice用INVITE请求发送一次给Bob,Bob用200(OK)应答发送一次给Alice。这个交换实现了基本的协商能力和简单的offer/answer模型。如果Bob不希望接听电话,或者他现在正忙(接听其它电话),那么他会发送一个错误应答而不是200(OK)应答。一个错误应答将不会建立会话。
Bob发送的200(OK)应答可能是这样的:
应答的第一行包含一个应答代码(200)和一个解释短语(OK)。其它行就是应答的头域。Via,To,From,Call-ID和CSeq头域的值都从INVITE请求拷贝而来(这时候应该有3个Via头域,分别由Alice的SIP软电话,atlanta.com代理服务器,和biloxi.com代理服务器添加)。Bob的SIP电话添加一个tag参数到To头域。以后所有的属于这个对话的请求和应答都要包含这个tag参数。
当Alice的软电话接收到这个200(OK)应答后,马上停止响铃并显示呼叫已经被接听了。最后,Alice发送一个确认信息(ACK)给Bob的SIP电话,表示自己收到了最终应答(200(OK))。这个例子中的最终应答由Alice直接发送给了Bob,这是因为Alice的软电话从Contact头域里面可以得到Bob的地址信息。通过INVITA/200/ACK的三步握手,SIP会话就建立起来了。关于SIP会话建立的详细步骤请参看RFC3261第13节。
现在Alice和Bob的多媒体会话已经建立起来了,他们可以发送通过SDP协商好的格式的媒体数据了。一般来说,媒体数据包的传输与SIP消息的传输采用不同的通信方式。SIP消息大多通过代理服务器转发,而媒体数据多使用点对点的传输。
在会话过程中,无论是Alice还是Bob决定改变这个媒体会话,都要通过发送一个re-INVITE请求。这个re-INVITE请求包含新的媒体描述(可能是SDP),它不会建立新的会话,而是修改当前已经存在的会话。对方接收到这个请求后,发送一个200(OK)同意这个改变,最后请求者发送ACK。如果对方不同意这个修改,可能会发送一个错误应答,比如488(不接受)。但是这个失败应答不会使已存在的会话退出,而是继续使用以前协商的媒体进行通信。关于修改一个会话的详细说明,请参看RFC3261第14节。
最后,Bob发送BYE消息挂断电话。BYE消息直接发送到Alice的软电话。Alice发送200(OK)确定接收到了BYE消息,并且终止这个会话。Bob不用发送ACK,因为ACK只有在接收到对INVITE的应答时才被发送。关于终止一个会话更详细的说明,请参看RFC3261第15节。还有一个问题就是关于biloxi.com服务器如何获得Bob的位置。Bob的SIP电话开机的时候会向一个注册服务器发送REGISTER消息。REGISTER消息的作用是将Bob的SIP URI或者SIPS URI与Bob当前使用的电话地址进行帮定,并将这个帮定信息保存到数据库中,这被称之为定位服务(location service)。biloxi.com代理服务器使用定位服务获得Bob的地址。注册服务器、代理服务器、定位服务器都是逻辑上的服务器,而不是物理上的服务器,所以他们可以位于同一台服务器上。