我们都知道并喜欢 EVPN 作为 VXLAN 隧道在第 3 层基础设施上的控制平面。 EVPN 使您能够在没有控制器的情况下部署 VXLAN 隧道。此外,它还提供了一系列其他好处,如通过 ARP 抑制减少数据中心流量、在移动性期间快速收敛、一个底层和覆盖路由协议以及支持多租户的固有能力。
VXLAN 的 EVPN 可以满足你所有的第二层需求,对吗?嗯,比这复杂一点。你或许还得在 VXLAN 之间以及 VXLAN 隧道和外部世界之间进行通信,因此在网络中也必须启用 VXLAN 路由,我在这篇文章中介绍了这一点。
VXLAN 路由可以使用以下两种架构之一执行:
集中式路由在一个或两个集中式路由器上执行所有 VXLAN 路由,这可能会在数据中心造成额外的东西向流量。
分布式路由在直接连接的叶交换机上提供最接近主机的 VXLAN 路由,简化了通信流。
这就是带 EVPN 的 VXLAN 路由的用武之地。 BGP-EVPN 用于将 VXLAN 第 3 层路由信息传送到叶。
VZX1 采用分布式体系结构,定义了两种利用 EVPN 实现子网间路由的模型:非对称综合路由桥接( IRB )和对称 IRB 。有些供应商提供对称模型,有些则提供非对称模型。
在 NVIDIA 网络中,我们相信您可以控制自己的网络。这两种模式都有价值,这取决于您的网络是如何建立的,以及谁 MIG ht 构建了您的传统网络系统。我们提供这两种解决方案,以便您可以选择适合您的网络的任何方法。
非对称模型与对称模型的区别
不对称 IRB 模型和对称 IRB 模型的主要区别在于路由查找的方式和位置。这会导致数据包在基础设施中传输的 VNI 不同。由于这些差异,它们在交换机上的配置方式以及在网络中的部署方式都有所不同。
不对称模型
非对称模型允许在 VXLAN 隧道入口上进行路由和桥接,但仅在出口上进行桥接。这导致双向 VXLAN 通信在路由基础设施的每个方向(始终是目标 VNI )的不同 VNI 上传输。
图 1 。非对称 VXLAN 流量
请考虑前面的例子。主机 A 希望与主机 B 通信,主机 B 位于不同的 VLAN 和不同的机架上,因此可以通过不同的 VNI 访问。
由于主机 B 与主机 a 位于不同的子网中,主机 a 将帧发送到其默认网关 Leaf01 。这通常是一个选播网关。
Leaf01 识别目标 MAC 地址本身,查找路由表,并在仍然在 Leaf01 上时将数据包路由到绿色 VNI 。
然后, Leaf01 将绿色 VNI 中的帧隧道到 Leaf02 。
Leaf02 从帧中删除 VXLAN 头,并将帧桥接到主机 B 。
同样,返回流量的行为也会类似。
主机 B 向 Leaf02 发送帧。
Leaf02 识别自己的目标 MAC 地址,并将数据包路由到 Leaf02 上的橙色 VNI 。
包在橙色的 VNI 中被隧道传输到 Leaf01 。
Leaf01 从帧中删除 VXLAN 头并将其桥接到主机 A 。
对于非对称模型,所有必需的源和目标 VNI (例如,橙色和绿色)必须出现在每个叶上,即使该叶在其机架的 VLAN 中没有主机。这可能会增加叶必须持有的 IP / MAC 地址的数量,从而导致规模有限。然而,在许多情况下,网络中的所有 vni 都配置在所有叶子上,以允许 VM 移动性并简化整个网络的配置。在这种情况下,非对称模型是可取的。
虽然它的可伸缩性不高,但使用非对称模型进行部署是一个简单的解决方案,因为不必配置额外的 VNI 或 VLAN 。此外,在 VXLAN 之间进行通信的路由跳数较少,因此延迟较低。
在需要多租户的情况下,还可以将每组 VLAN 放在单独的 VRF 中,并在 VRF 中的 VLAN 之间进行路由。
对称模型
对称模型在入口和出口叶上都有路由和桥。这导致双向通信能够在同一个 VNI 上传输,因此有了对称的名称。
然而,一种新的专用传输 VNI 用于所有路由 VXLAN 通信,称为 L3VNI 。所有必须路由的流量都路由到 L3VNI 上,通过第 3 层基础设施进行隧道传输,从 L3VNI 路由到相应的 VLAN ,并最终桥接到目标。
图 2 。对称 VXLAN 流量
现在考虑具有对称模型的场景(图 2 )。 VLAN A 上的主机 A 必须与 VLAN B 上的主机 B 通信。
因为目标与主机 a 是不同的子网,所以主机 a 将帧发送到其默认网关 Leaf01 。
Leaf01 识别目标 MAC 地址本身,并使用路由表将数据包路由到 L3VNI 和下一跳 Leaf02 。
VXLAN 封装的数据包将出口叶的 MAC 作为目标 MAC 地址,将此 L3VNI 作为 VNI 。
Leaf02 执行 VXLAN 解封装,并识别目标 MAC 地址本身,并将数据包路由到目标 VLAN ,以到达目标主机。
返回流量在相同的 L3VNI 上以类似方式路由。
在对称模式下,叶交换机只需要托管位于其机架上的 VLAN 和相应的 VNI ,以及 L3VNI 及其关联的 VLAN 。这是因为入口叶开关不需要知道目标 VNI 。
只托管本地 vni (外加一个额外的)的能力有助于扩展。但是,由于您的网络中需要额外的 VXLAN 隧道和 VLAN ,因此配置更为复杂。当发生额外的路由跳时,数据平面通信也会变得更加复杂,并可能导致额外的延迟。
多租户要求每个 VRF 有一个 L3VNI ,参与该 VRF 的所有交换机必须配置相同的 L3VNI 。出口叶使用 L3VNI 来标识要在其中路由分组的 VRF 。
哪个 IRB 模型是正确的?
选择 IRB 模型最困难的部分是了解对称和非对称方法之间的区别。既然你知道了两者的区别,你就可以做出一个明智的决定,为你的人际网络提供最佳的选择。
一般来说,如果您配置了所有叶上的所有 VLAN 、子网或 vni (为了移动性或配置的方便性),那么非对称模型适合您。它的配置更简单,并且不需要额外的 VNIs 来进行故障排除。它甚至可能有稍微少的延迟。
如果您的数据中心可以分解为包含 VLAN 和子网的 Pod ,那么非对称模型也可以很好地工作。 Pod 中的每个叶都配置了本地 Pod 中的所有 vlan 和子网或 VNIs 。其他 pod 和外部网络可以通过 EVPN 外部路由到达。 Cumulus Linux 3.6 版本支持带有非对称模型的 EVPN 外部路由,仅将 L3VNI 用于外部路由。
如果您的 VLAN 、子网或 VNI 分布广泛或动态配置,请选择对称模型。对称模型支持 Cumulus Linux 3.5 对外部网络的可达性。
NVIDIA 相信您拥有并控制您的网络,而不是专有供应商,因此我们提供这两种解决方案,让您可以选择。
关于作者
Rama Darbha 是 NVIDIA 网络组的解决方案架构主管,主要负责数据中心、 NetDevOps 和以太网交换。他热衷于帮助客户和合作伙伴通过开放的网络策略,充分利用他们的人工智能和计算工作负载。 RAMA 有一个活跃的 CCONP 2019 :: 19 和 CCIE × 22804 ,拥有杜克大学工程与管理硕士学位。
审核编辑:郭婷
全部0条评论
快来发表一下你的评论吧 !