<!-- AI_TASK_START: AI标题翻译 -->
[解决方案] 百思买健康采用 AWS Cloud WAN 和 SD-WAN 打造高韧性客户服务中心
<!-- AI_TASK_END: AI标题翻译 -->
<!-- AI_TASK_START: AI竞争分析 -->
# 解决方案分析
## 解决方案概述
该解决方案详细阐述了 **Best Buy Health (百思买健康)** 如何利用 **AWS Cloud WAN** 与 **Fortinet SD-WAN** 为其护理中心构建一个高弹性的云原生网络架构。核心目标是解决原有架构中,关键的健康相关语音流量需绕行本地数据中心而导致的 **高延迟**、**高成本** 和 **运维复杂** 等问题。该方案适用于零售和医疗保健等行业,满足分支机构(如联络中心、门店)与云端工作负载之间对低延迟、高可用连接的严苛要求。其技术原理在于采用创新的 **“双独立”(dual-standalone)** 架构,在两个AWS可用区(AZ)中部署独立的Fortinet SD-WAN虚拟设备,通过AWS Cloud WAN的 **无隧道连接(Tunnel-less Connect)** 实现与云端工作负载的直接、冗余和高性能连接,以此替代传统的主备高可用(HA)模型。
## 实施步骤
1. **架构选型与优化**
- 在 **AWS Transit Gateway Connect** 和 **AWS Cloud WAN 无隧道连接** 两种方案中进行评估。
- 最终选择AWS Cloud WAN,因其具备更强的多区域扩展能力、更高的带宽潜力和更简化的集中式管理模型,可显著降低运维开销。
2. **部署双独立SD-WAN头端**
- 在AWS云上的两个不同可用区(AZ)中,分别部署一台 **Fortinet FortiGate SD-WAN虚拟机**。
- 每台虚拟机独立运行,互不影响,构成“双独立”架构的核心,避免了传统主备模式的故障切换收敛问题。
3. **建立云端网络连接**
- 使用单个 **AWS Cloud WAN Connect附件**,并为其配置两个独立的 **BGP Peer**,分别与两台FortiGate虚拟机建立对等连接。
- 采用 **无隧道连接** 模式,消除了GRE隧道的封装开销,提升了数据传输吞吐量并简化了故障排查。
4. **配置分支机构连接**
- 每个护理中心的分支机构均配备双互联网线路。
- 分支机构的FortiGate设备通过冗余链路,同时与云上两个可用区的FortiGate头端设备建立覆盖网络隧道(overlay tunnels),形成端到端的多路径冗余。
5. **路由与网络分段管理**
- 在AWS Cloud WAN中创建独立的 **网络分段(Segment)**,如SD-WAN分段、生产环境分段和非生产环境分段,以实现严格的环境隔离。
- 利用 **分段路由共享** 功能,让SD-WAN分段与各工作负载分段之间自动学习和传播路由,无需手动管理路由表,实现了网络的自动化管理。
## 方案客户价值
- **显著降低延迟:** 新架构将流量直接从护理中心路由至AWS,_往返延迟降低了66%_。这直接提升了处理关键健康语音业务的座席和客户的体验。
- **提升网络弹性与可用性:**
- “双独立”架构确保在 **计划内维护** (如系统升级、打补丁) 期间,可实现无缝的流量切换,避免业务中断。
- 通过双AZ部署、双头端设备和分支机构双链路,构建了强大的端到端多路径冗余,有效抵御单点故障。
- **降低运营成本与复杂性:**
- 流量不再经过昂贵的MPLS链路和本地数据中心,直接降低了网络传输成本。
- AWS Cloud WAN的集中式策略和自动化路由管理,**显著减轻了网络团队的运维负担**。
- **践行云原生战略:** 方案实现了分支机构到云端工作负载的直接连接,彻底摆脱了对本地数据中心的依赖,完全符合企业的 **“云优先”** 战略。
## 涉及的相关产品
- **AWS Cloud WAN:** 作为云端广域网的核心,提供全局网络连接、流量分段和集中式策略管理。
- **Amazon VPC:** 用于托管SD-WAN虚拟设备以及后端的应用工作负载。
- **Amazon Route 53 Resolver:** 其网络接口被用作SD-WAN设备的健康检查目标,以实现更精准的IP服务等级协议(SLA)路径选择。
- **Fortinet FortiGate SD-WAN:** 作为企业级SD-WAN解决方案,部署在云端(头端)和分支机构,提供覆盖网络连接、路径优化和安全功能。
## 技术评估
该解决方案在技术上具有显著的创新性和实用价值,但也存在明确的权衡。
- **优势:**
- **架构创新:** “双独立”模型是该方案的最大亮点,它巧妙地规避了传统主备模式在计划内维护时因BGP收敛时间过长而导致的业务中断问题。
- **高性能:** 采用 **无隧道连接**,避免了GRE封装带来的性能开销和单流限制,提供了更高的带宽潜力和更简化的网络路径。
- **高可扩展性:** 架构易于横向扩展,添加新的分支机构或工作负载VPC时,无需对核心基础设施进行重大变更。
- **集中化管理:** AWS Cloud WAN提供基于意图的策略框架,支持版本化和回滚,极大地简化了全球网络的管理和安全策略的统一部署。
- **局限性与权衡:**
- **意外故障收敛延迟:** 在发生 **意外灾难性故障** (如整个AZ或VM宕机)时,AWS Cloud WAN将返回流量完全重定向到另一个健康的节点仍需约 **30秒** 的BGP收敛时间。
- **无会话同步:** “双独立”架构中的两个SD-WAN节点独立工作,**无法进行会话同步**。这意味着当流量路径切换时,进行中的会话可能会中断。
- **安全策略调整:** 为解决无会话同步导致连接中断的问题,方案中必须在云端头端设备上 **禁用有状态检测** 功能。这是一个重要的安全权衡,依赖于分支机构侧的SD-WAN设备来维持完整的安全检测边界。
<!-- AI_TASK_END: AI竞争分析 -->
<!-- AI_TASK_START: AI全文翻译 -->
# 基于 AWS Cloud WAN 和 SD-WAN 打造 Best Buy Health 的弹性关怀中心
**原始链接:** [https://aws.amazon.com/blogs/networking-and-content-delivery/best-buy-healths-resilient-care-centers-powered-by-aws-cloud-wan-and-sd-wan/](https://aws.amazon.com/blogs/networking-and-content-delivery/best-buy-healths-resilient-care-centers-powered-by-aws-cloud-wan-and-sd-wan/)
**发布时间:** 2025-08-19
**厂商:** AWS
**类型:** BLOG
---
在零售和医疗保健行业,通过高弹性网络实现关键连接对于服务客户和运营至关重要。这些行业的客户通常需要将其企业网络连接到门店、联络中心、分销中心,或者像 Best Buy Health 这样的客户关怀联络中心。[Best Buy Health](https://www.bestbuyhealth.com/) 为患者和客户提供护理解决方案,这些方案需要高弹性的语音网络路径,包括家庭护理解决方案、专为老年人设计的简化移动电话设备,以及为技术、紧急和社交需求提供支持的专业健康响应团队。本文将深入探讨 Best Buy Health 所采用的一套综合技术解决方案,该方案使用 Amazon Web Services (AWS) [Cloud WAN](https://aws.amazon.com/cloud-wan/) 将 Fortinet FortiGate 软件定义广域网 (Software Defined Wide Area Networks, SD-WAN) 集成到 [Amazon Virtual Private Cloud](https://aws.amazon.com/vpc/) (Amazon VPC) 中。这种独特的双独立架构避免了传统高可用性 (High Availability, HA) 架构的弊端,并将在 AWS 中连接客户与工作负载的延迟降低了 66%。
## Best Buy Health 的使命
Best Buy Health 的使命是通过技术丰富人们的生活。它已成长为一个家喻户晓的品牌,成为高品质电子产品和卓越客户服务的代名词。作为 Best Buy 的一个部门,Best Buy Health 旨在通过技术和有意义的连接来丰富和拯救生命。Best Buy Health 专注于通过提供消费级健康产品来实现在家护理,帮助客户过上更健康的生活,为活跃的老年人群提供基于设备的紧急响应服务,以及帮助连接患者和医生的虚拟护理服务。
## Best Buy 的云原生网络架构
Best Buy 有一项云优先策略,即新的工作负载 (workloads) 和支持性基础设施解决方案都应尝试使用云原生方案。对于 Best Buy Health 重要的健康相关语音流量而言,从关怀中心到 AWS 中工作负载的低延迟和高可用连接至关重要。这些流量可能与医疗紧急情况有关,因此需要一个稳健的架构。
在讨论 Best Buy Health 的云原生现状网络架构之前,下一节将展示其先前的架构。
### 先前架构
图 1 展示了 Best Buy Health 最初用于连接 AWS 工作负载与关怀中心的设计。

*图 1: Best Buy Health 先前的网络架构,通过本地数据中心进行路由*
该设计遵循了 Best Buy Health 最初在云优先策略之前的设计原则。来自 Best Buy Health 关怀中心的流量通过多协议标签交换 (Multi-Protocol Label Switching, MPLS) 广域网的多跳路由至其数据中心,然后通过 [AWS Direct Connect](https://aws.amazon.com/directconnect/) 连接和 Direct Connect 网关到达 [AWS Transit Gateway](https://aws.amazon.com/transit-gateway/) 。之后,流量最终被路由到包含应用工作负载的目标生产和非生产 VPC (连接到各自的 Transit Gateway)。尽管这种先前状态通过主/备 (active/passive) 配置实现了高可用性,但通过数据中心进行路由并不理想。
### 先前架构的挑战
Best Buy Health 的关怀中心通过连接到 AWS 中的工作负载并经由 Best Buy 数据中心路由来为客户提供服务。该设计存在一些缺点,例如:
- 敏感的语音流量增加了数毫秒的延迟和更多的网络跳数,导致客户体验下降。
- 通过 MPLS 广域网和本地数据中心路由产生了电信运营商的网络数据传输成本。
- 网络运营团队需要管理 MPLS 广域网链路、Direct Connect 连接和 Transit Gateway 路由表,增加了运维开销 (operational overhead)。
- 最重要的是,先前的设计不符合 Best Buy 的云原生设计要求,并继续依赖其数据中心。
因此,需要一种新的解决方案来改善客户体验、遵循 Best Buy 的设计原则并减少运维开销。
### 使用 AWS Cloud WAN 的现状架构
当时评估了两种 AWS 云原生的 SD-WAN 连接解决方案:
1. Transit Gateway 与 [Transit Gateway Connect 连接](https://docs.aws.amazon.com/vpc/latest/tgw/tgw-connect.html)
2. AWS Cloud WAN 与 [无隧道 Connect 连接 (Tunnel-less Connect attachments)](https://docs.aws.amazon.com/network-manager/latest/cloudwan/cloudwan-connect-attachment.html)
Best Buy 在其零售业务中使用 Transit Gateway Connect 连接的经验,促使他们为 Best Buy Health 选择 AWS Cloud WAN,原因如下:
- AWS Cloud WAN 提供了全面的多区域 (Region) 联网能力,并内置了跨 AWS 区域的动态路由 (dynamic routing) 支持,同时抽象了网络管理的复杂性。目前,Best Buy Health 的工作负载使用单个区域 (us-west-2)。AWS Cloud WAN 通过使用全局路由表和网络分段 (segmentation),实现了未来 AWS 区域的无缝扩展和简化的路由配置。AWS Cloud WAN 无需手动配置和维护单个 Transit Gateway,从而显著减少了运维开销,同时通过一致的策略执行和跨全球基础设施的集中式网络管理,原生增强了安全性。
- AWS Cloud WAN 的无隧道 Connect 连接允许 [更高的带宽](https://docs.aws.amazon.com/network-manager/latest/cloudwan/cloudwan-quotas.html#cloudwan-bandwidth) 并减少了开销,因为它们在 SD-WAN 设备和 AWS Cloud WAN 网络之间不需要通用路由封装 (Generic Routing Encapsulation, GRE) 隧道。另一方面,Transit Gateway Connect 连接需要在 SD-WAN 设备和 Transit Gateway 之间建立 GRE 隧道,从而限制了可实现的 [最大带宽](https://docs.aws.amazon.com/vpc/latest/tgw/transit-gateway-quotas.html#bandwidth-quotas) 。
- AWS Cloud WAN 通过一个集中的策略驱动框架提供动态路由、分段和全局路由表,从而简化了多区域网络。这种基于意图的方法,支持带回滚功能的版本化策略文档,减少了配置的运维开销,同时确保了跨全球基础设施的一致安全性和网络管理。
当 Best Buy 开始使用 AWS Cloud WAN 和无隧道 Connect 连接实施 SD-WAN 时,他们遵循了其 SD-WAN 供应商 Fortinet 提供的传统主备 (active-standby) 高可用性参考架构。不久之后,他们发现在故障切换 (failover) 事件期间,BGP 收敛 (BGP convergence) 时间会中断从客户到客户关怀中心的实时语音流量。因此,需要一种新的 SD-WAN 架构来消除这些收敛时间。Best Buy 尝试了其他架构,最终确定了一种独特的双独立 (dual-standalone) 架构。该架构能够在 SD-WAN 设备的计划内维护 (planned maintenance) 事件 (如打补丁、代码升级等) 期间实现无缝的流量收敛,并减少了计划外维护 (unplanned maintenance) 期间的收敛时间,包括 SD-WAN 设备或 [AWS 可用区 (Availability Zone, AZ)](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/using-regions-availability-zones.html#concepts-availability-zones) 的灾难性故障 (catastrophic failures)。
### 现状架构详情
图 2 展示了 Best Buy Health 当前的网络架构,该架构使用 Fortinet FortiGate SD-WAN 设备和 AWS Cloud WAN 在关怀中心与运行在 Amazon VPC 中的应用程序之间路由流量。

*图 2: Best Buy Health 当前使用 Fortinet FortiGate SD-WAN 设备和 AWS Cloud WAN 的网络架构*
在当前架构中,Fortinet FortiGate SD-WAN 虚拟机 (Virtual Machines, VMs) 作为头端设备 (headend devices) 部署在两个可用区中,提供冗余的同时保持与 AWS Cloud WAN 的无缝集成。与传统的主备配置不同,该架构实现了一个双独立模型,其中两个虚拟机同时为 Best Buy Health 关怀中心提供服务。每个虚拟机都维护双弹性网络接口 (Elastic Network Interfaces, ENIs):一个接口位于私有子网 (private subnet) 中,另一个位于映射到弹性 IP 地址 (Elastic IP address, EIP) 的公有子网 (public subnet) 中。这些虚拟机独立运行,通过公共互联网拥有专用的底层网络 (underlay),并与 AWS Cloud WAN 建立 BGP-over-IPSec (互联网协议安全) 覆盖网络 (overlay)。这确保了一个虚拟机的故障不会影响另一个。因此,流量路径得以简化,减少了延迟、跳数和复杂性,因为不再需要 AWS Direct Connect。Best Buy Health 关怀中心通过互联网上的两条独立路径,使用 SD-WAN 直接连接到 AWS。这缓解了对互联网线路不可靠性的担忧。
每个关怀中心的 FortiGate 设备都使用 SD-WAN VPC 可用区中的 [Amazon Route 53](https://aws.amazon.com/route53/) 解析器 ENI (Resolver ENI) 作为 [健康检查 IP 服务等级协议 (Service Level Agreement, SLA)](https://docs.fortinet.com/document/fortigate/6.2.0/cookbook/478384/performance-sla-link-monitoring) 的目标。SD-WAN 架构的最佳路径是根据从这些 IP SLA 目标收集的指标来确定的。Best Buy 选择不使用 SD-WAN 头端设备本身进行 IP SLA,以确保设备和可用区之间的独立性。这种设计提供了真正的双独立冗余,而非传统的故障切换配置。
## 集成策略、结果与考量
Best Buy 独特的双独立方法及其与 AWS Cloud WAN 的集成,取得了满足 Best Buy Health 特定业务需求的结果。这些成果包括改善的流量、简化的架构、快速的故障切换,以及关怀中心员工在使用 AWS 中工作负载时性能的提升。在以下各节中,我们将详细介绍决策过程、集成策略、权衡以及实际观察到的性能。
### AWS Cloud WAN 集成策略
与 AWS Cloud WAN 的集成使用 VPC 连接 (VPC attachment) 作为基础传输机制。两个 SD-WAN 虚拟机共享一个 Connect 连接 (上文图 2 中的浅蓝色线框),同时通过跨越虚拟机私有接口所在私有子网的 VPC 传输连接来维持各自的连接路径。此 Connect 连接支持两个 AWS Cloud WAN 无隧道 Connect BGP 对等体 (BGP peers),每个虚拟机专有一个 Connect BGP 对等体 (上文图 2 中的绿线)。使用无隧道 Connect BGP 对等体更有利,因为它消除了五元组单流原则 (five-tuple single flow principle) (该原则由 Transit Gateway Connect 连接中的 GRE 隧道强制执行)。无隧道 Connect BGP 对等体还允许更高的吞吐量 (throughput),并且对等体地址可以直接对应 SD-WAN 虚拟机的私有接口 IP 地址。最后,它减少了线路开销并简化了故障排查。
### 分支机构连接与 BGP 路由
所有分支机构 (branch) 的 FortiGate 设备都与两个头端 SD-WAN 虚拟机的公共接口建立覆盖网络隧道。分支机构级别的冗余包括每个站点的双互联网线路。这与双头端虚拟机相结合,创建了稳健的多路径冗余。每个虚拟机通过各自的 AWS Cloud WAN Connect 对等体与 AWS Cloud WAN 核心网络边缘 (Core Network Edge, CNE) 建立独立的 BGP 邻居关系。传输 VPC 连接与 AWS Cloud WAN 内专用的 SD-WAN 分段相关联,这确保了 Connect 连接继承相同的分段成员资格。
当 BGP 会话正常运行时,路由变为双向的。从 SD-WAN 虚拟机出站到 AWS Cloud WAN 的允许路由会传播到整个 SD-WAN 分段。在分段内学到的路由会传播回虚拟机,从而提供完整的路由可见性和控制。
### 工作负载网络集成
生产和非生产工作负载 VPC 与各自专用的 AWS Cloud WAN 分段相关联,从而保持环境隔离。路由传播使用 AWS Cloud WAN 的分段共享 (segment sharing) 功能,生产和非生产分段与 SD-WAN 分段双向共享路由信息。这种分段共享模型使 SD-WAN 虚拟机能够学习到工作负载网络,而无需直接连接到生产和非生产分段,从而在确保连接的同时维护了安全边界。工作负载 VPC 网络被动态传播到 SD-WAN 虚拟机的路由表中,从而消除了手动路由管理。
### 独特的连接模型:双独立或传统高可用性
Best Buy 的一个重要需求是实现亚秒级 (sub-second) BGP 收敛。Best Buy Health 业务的性质决定了重要的健康相关语音流量在 SD-WAN 头端设备进行计划内维护或发生计划外中断时不能被中断。这通常需要较长的 BGP 收敛时间。在传统的其中一台虚拟机处理所有路由功能而另一台保持备用状态的主备配置中,故障切换事件可能会导致中断。这些配置依赖于 AWS Cloud WAN 内的默认 BGP 计时器 (keepalive 和 holddown),并且由于目前不支持双向转发检测 (Bidirectional Forwarding Detection, BFD),BGP 收敛时间无法被最小化。双独立模型通过维持来自两个虚拟机的持续活动会话来规避时间依赖性。因此,路由收敛变得不那么关键,因为替代路径始终可用。
### 实际性能成果
尽管这种双独立架构提供了显著优势,但实际测试揭示了一些组织必须了解的重要限制。在灾难性故障场景中,当流量从可用区 1 切换到可用区 2 (例如公共接口故障或虚拟机无响应) 时,AWS Cloud WAN 仍需要大约 30 秒才能将从 AWS 返回到 Best Buy Health 分支机构的流量完全重定向到可用区 2 的 FortiGate 虚拟机。由于该架构是从之前数据中心作为路由路径一部分的配置演变而来,Best Buy 观察到往返延迟 (round trip latency) 降低了 66%,这直接转化为关怀中心员工和客户体验的改善。
双独立模型主要为计划内维护场景提供无缝故障切换,但在应对意外的灾难性故障和等价多路径 (Equal-Cost Multi-Path, ECMP) 路由实施方面面临挑战。尽管存在这些限制,该架构仍提供了显著的好处,如高可用性、减少单点故障、降低延迟和自动化路由传播。它可以高效扩展,允许在不改变核心基础设施的情况下增加新的分支机构和工作负载 VPC。然而,组织必须仔细考虑 AWS Cloud WAN Connect 连接的带宽需求,因为它们处理所有分支机构到工作负载的流量。虽然此解决方案并非适用于所有场景,但它为企业网络提供了一个稳健且可扩展的网络架构,具备零停机维护能力,平衡了性能和可管理性。
### 其他考量
与许多架构解决方案一样,这里也存在权衡:其中最重要的是 SD-WAN 技术的同步能力。传统的 SD-WAN 高可用性在节点之间提供会话同步 (session synchronization),确保连接状态和安全策略在故障切换事件期间保持一致。Best Buy 的双独立模型无法提供会话同步,因为虚拟机独立运行,没有共享状态信息。这一限制要求在头端 SD-WAN 虚拟机上禁用状态检测 (stateful inspection) 功能,以防止在虚拟机之间切换流量路径时连接中断。尽管这在头端层面是一种安全权衡,但分支机构的 SD-WAN 设备保留了完整的安全检测能力,确保了安全检测边界的完整性。
## 结论
Best Buy Health 的双独立 SD-WAN 集成解决方案代表了对传统高可用性模型的创新性突破,它优先考虑性能和收敛速度,而非某些安全特性。通过将 FortiGate SD-WAN 的能力与 AWS Cloud WAN 的高级路由功能相结合,Best Buy Health 实现了可随云采用而扩展的企业级网络。对于 Best Buy Health 的客户而言,由于先前架构的延迟降低了 66%,当他们的关怀中心员工使用托管在 AWS 上的应用程序时,这意味着客户体验的改善。该解决方案尤其适用于那些有严格收敛要求的组织,例如支持语音通信的组织,同时通过在分支机构进行分布式检测来维护安全边界。Best Buy Health 的独特设计帮助他们继续通过重要的医疗保健客户关怀中心为客户带来愉悦的体验。
要了解更多关于为您的组织实施 AWS Cloud WAN 的信息,请访问 [AWS Cloud WAN 文档](https://docs.aws.amazon.com/network-manager/latest/cloudwan/what-is-cloudwan.html) 。
## 关于作者

Mandar Sawant 是一名高级解决方案架构师,在 AWS 核心网络服务方面拥有广泛经验,帮助客户设计遵循“架构完善” (Well-Architected) 框架的解决方案。他热衷于网络技术,喜欢创新并帮助解决复杂的客户问题。Mandar 拥有密苏里大学堪萨斯城分校的计算机网络硕士学位。Mandar 常驻西雅图,喜欢户外摄影。

Moulee Natarajan 是 Best Buy 的一名资深网络工程师,专注于数据中心和云网络核心服务。他热衷于网络技术,并乐于设计、构建和支持可靠的网络解决方案。他的兴趣包括传统数据中心、SDN、安全、SD-WAN 以及私有云和公有云的跨云连接。

Jason Schamp 是一名首席解决方案架构师,常驻俄亥俄州克利夫兰。Jason 专注于指导企业零售/消费品客户完成他们的云之旅,加速迁移、实现工作负载现代化并采用新的工作方式。Jason 的专长是安全与合规,并对容器安全、云运营、自动化和自助服务充满热情。
<!-- AI_TASK_END: AI全文翻译 -->