WebRTC是什么
Han Lv5

WebRTC 是 Web 实时通信(Real-Time Communication)的缩写,它既是 API 也是协议。WebRTC 协议是两个 WebRTC Agent 协商双向安全实时通信的一组规则。开发人员可以通过 WebRTC API 使用 WebRTC 协议。目前 WebRTC API 仅有 JavaScript 版本。

可以用 HTTP 和 Fetch API 之间的关系作为类比。WebRTC 协议就是 HTTP,而 WebRTC API 就是 Fetch API。

除了 JavaScript 语言,WebRTC 协议也可以在其他 API 和语言中使用。你还可以找到 WebRTC 的服务器和特定领域的工具。所有这些实现都使用 WebRTC 协议,以便它们可以彼此交互。

WebRTC 协议由 IETF 工作组在rtcweb中维护。WebRTC API 的 W3C 文档在webrtc

为什么我应该学习 WebRTC? #

下面这些是 WebRTC 可以带给你的东西。这并不是一份详尽的清单,只是列举一些你在学习中可能感兴趣的点。如果你还不了解所有这些术语,请不要担心,本书将陆续将这些概念教给你。

  • 开放标准
  • 多种实现
  • 在浏览器中可用
  • 强制加密
  • NAT 穿透
  • 复用现有技术
  • 拥塞控制
  • 亚秒级延迟

WebRTC 协议是一组其他技术的集合体 #

这个主题需要整本书来解释。但是,首先,我们将其分为四个步骤。

  • 信令(Signaling)
  • 连接(Connecting)
  • 安全加密(Securing)
  • 通信(Communicating)

这四个步骤依次发生。上一个步骤必须 100%成功,随后的步骤才能开始。

关于 WebRTC 的一个特殊事实是,每个步骤实际上都是由许多其他协议组成的!为了让 WebRTC 工作起来,我们将许多现有技术结合在一起。从这个意义上讲,WebRTC 更像是 2000 年代早期以来就已经存在的一些易于理解的技术的组合和配置。

每个步骤都有专门的章节,但是首先从较高的层次上理解它们会有所帮助。由于它们彼此依赖,因此理解这些在进一步解释每个步骤的目的时会有所帮助。

信令:peer 如何在 WebRTC 中找到彼此 #

当 WebRTC Agent 启动时,它不知道与谁通信以及他们将要通信的内容。信令解决了这个问题!信令用于引导呼叫,以便两个 WebRTC Agent 可以开始通信。

信令使用一种现有的协议 SDP(会话描述协议)。SDP 是一种纯文本协议。每个 SDP 消息均由键 / 值对组成,并包含“media sections(媒体部分)”列表。两个 WebRTC Agent 交换的 SDP 所包含一些详细信息,如:

  • Agent 可供外部访问的(候选的)IP 和端口。
  • Agent 希望发送多少路音频和视频流。
  • Agent 支持哪些音频和视频编解码器。
  • 连接时需要用到的值(uFrag/uPwd)。
  • 加密传输时需要用到的值(证书指纹)。

注意,信令通常发生在“out-of-band”。也就是说,应用通常不使用 WebRTC 本身来交换信令消息。在连接的 peer 中,任何适合发送消息的架构均可被用于传递 SDP 信息,许多应用程序都使用其现有的基础设施(例如 REST 端点,WebSocket 连接或身份验证代理)来解决适当客户端之间的 SDP 传递问题。

使用 STUN/TURN 进行连接和 NAT 穿透 #

现在,两个 WebRTC Agent 知道足够的详细信息以尝试相互连接。接下来,WebRTC 将使用另一种成熟的技术,称为 ICE。

ICE(交互式连接建立)是 WebRTC 前现有的协议。ICE 允许在两个 Agent 之间建立连接。这些 Agent 可以在同一网络上,也可以在世界的另一端。ICE 是无需中央服务器即可建立直接连接的解决方案。

这里真正的魔法是“ NAT 穿透”和 STUN/TURN 服务器。这两个概念是与另一个子网中的 ICE Agent 进行通信所需的全部。稍后我们将深入探讨这些主题。

ICE 成功连接后,WebRTC 就会继续建立加密传输。加密传输用于音频,视频和数据。

使用 DTLS 和 SRTP 加密传输层 #

现在我们有了双向通信(基于 ICE),我们需要建立安全的通信。这是基于 WebRTC 前已有的两种协议完成的。第一个协议是 DTLS(数据报传输层安全性),即基于 UDP 的 TLS。TLS 是一个加密协议,用于保护基于 HTTPS 的安全通信。第二种协议是 SRTP(安全实时传输协议)。

首先,WebRTC 通过在 ICE 建立的连接上进行 DTLS 握手来进行连接。与 HTTPS 不同,WebRTC 不使用中央授权来颁发证书。相反,WebRTC 只是判断通过 DTLS 交换的证书是否与通过信令共享的签名相符。然后,此 DTLS 连接可以被用于传输 DataChannel 消息。

接下来,WebRTC 使用 RTP 协议进行音频 / 视频的传输。我们使用 SRTP 来保护我们的 RTP 数据包。我们从协商的 DTLS 会话中提取密钥,用来初始化 SRTP 会话。在后续章节中,我们会讨论为什么媒体传输需要有它自己的协议。

现在我们完成了!你现在可以进行安全的双向通信。如果你的 WebRTC Agent 之间具有稳定的连接,以上这些就是你可能需要解决的所有复杂问题了。不幸的是,现实世界中存在数据包丢失和带宽限制等问题,下一节我们会介绍如何处理这些问题。

通过 RTP 和 SCTP 进行点对点通信 #

现在,我们有了两个具有安全的双向通信功能的 WebRTC Agent。让我们开始通信!跟前面一样,我们使用两个现有的协议:RTP(实时传输协议)和 SCTP(流控制传输协议)。我们使用 RTP 来交换用 SRTP 加密过的媒体数据,使用 SCTP 发送和接收那些用 DTLS 加密过的 DataChannel 消息。

RTP 很轻量,但是提供了实现实时流式传输所需的功能。最重要的是,RTP 为开发人员提供了灵活性,因此他们可以根据需要来处理延迟,丢失和拥塞。我们将在媒体章节中对此进行进一步讨论。

协议栈中的最后一个协议是 SCTP。SCTP 支持许多不同的消息传送选项。你可以根据需要开启不可靠传输,无序传输等选项,以便获得实时系统所需的低延迟。

WebRTC 是一系列协议的集合 #

WebRTC 解决了许多问题。初看起来,这似乎是过度设计的。实际上,WebRTC 非常克制。它并未认为它可以更好的解决所有问题。相反,它采纳了许多现有的解决某个特定问题的技术,然后将它们有机地结合起来。

这使得我们可以独立的检查和学习每个部分,而不会毫无头绪。实际上,从另一个角度去看“ WebRTC Agent”,它只是许多不同协议的协调器。

WebRTC Agent

WebRTC(API)如何工作 #

本部分显示 JavaScript API 是如何跟协议相对应的。这不是一个 WebRTC API 的详细演示,更多的是为了创建一个思维模型,展现各个模块是如何串联起来的。如果你对各个模块都还不熟悉,那也不要紧。当你了解更多信息时,再回头看看这一部分,可能会很有趣!

new RTCPeerConnection #

RTCPeerConnection 是最顶层的 “WebRTC 会话 “。它包含上述所有协议。调用后,所有子系统都会被创建,但是此时什么都还没有发生。

addTrack #

addTrack 创建一个新的 RTP 流。会为这个 RTP 流生成一个随机的 SSRC(Synchronization Source/ 同步源)。在后续 createOffer 生成会话描述中,这个 RTP 流会被放入一个 media section。每次调用 addTrack 都会创建一个新的 SSRC 和一个对应的 media section。

在建立 SRTP 会话后,这些媒体数据包将被 SRTP 加密,然后立即通过 ICE 开始发送。

createDataChannel #

当没有 SCTP 关联 (SCTP Association) 存在时,createDataChannel 将创建一个新的 SCTP 流。默认情况下,SCTP 是不启用的,只有在一方请求数据通道时才启动。

在 DTLS 会话建立之后,SCTP 关联将立即通过 ICE 发送数据包,并使用 DTLS 加密。

createOffer #

createOffer 生成会话描述,里面是需要与远端 Peer 分享的本地信息。

调用 createOffer 的行为对于本地 Peer 没有任何改变。

setLocalDescription #

setLocalDescription 提交所有请求的更改。 addTrack createDataChannel 和其他类似的调用都是临时的 (调用 setLocalDescription 后生效)。 调用 setLocalDescription 时,使用由 createOffer 生成的值。

通常,在此调用之后,你会将 offer 发送给远端 Peer,他们将调用 setRemoteDescription,将此 offer 设入。

setRemoteDescription #

收到远端 Peer 发来的 offer 之后,我们通过 setRemoteDescription 通知本地 Agent。这就是使用 JavaScript API 传递“信令”的方式。

双方都调用过 setRemoteDescription 后,WebRTC Agent 现在拥有足够的信息来开始进行点对点(P2P)通信!

addIceCandidate #

addIceCandidate 允许 WebRTC Agent 随时添加更多的远程 ICE 候选对象。该 API 将 ICE 候选对象发送到 ICE 子系统,并且对更大的 WebRTC 连接没有其他影响。

ontrack #

ontrack 是收到远端 Peer 的 RTP 数据包时触发的回调。传入的 RTP 数据包的格式应该已在传递给 setRemoteDescription 的会话描述中声明。

WebRTC 使用 SSRC 并查找关联的 MediaStreamMediaStreamTrack,并使用 MediaStreamMediaStreamTrack 中的详细信息来触发此回调。

oniceconnectionstatechange #

oniceconnectionstatechange 是 ICE Agent 的状态变化时触发的回调。当网络连接或断开时,你将得到此通知。

onconnectionstatechange #

onconnectionstatechange 是 ICE Agent 和 DTLS Agent 状态的组合。当 ICE 和 DTLS 都成功完成时,你将得到此通知。

 评论