Mạng lưới gai-lá (Spine-Leaf Network) chính xác là gì? Mạng lưới gai-lá của các mạng lưới lớp phủ (Underlay Networks)

Để đáp ứng nhu cầu của dịch vụ đám mây, mạng lưới đang dần được chia thành mạng lớp dưới (Underlay) và mạng lớp trên (Overlay). Mạng lớp dưới bao gồm các thiết bị vật lý như định tuyến và chuyển mạch trong trung tâm dữ liệu truyền thống, vẫn giữ nguyên khái niệm về tính ổn định và cung cấp khả năng truyền tải dữ liệu mạng đáng tin cậy. Mạng lớp trên là mạng nghiệp vụ được bao bọc trên đó, gần gũi hơn với dịch vụ, thông qua việc mã hóa giao thức VXLAN hoặc GRE, để cung cấp cho người dùng các dịch vụ mạng dễ sử dụng. Mạng lớp dưới và mạng lớp trên có mối liên hệ và tách rời nhau, đồng thời cũng có thể phát triển độc lập.

Mạng nền (Underlay network) là nền tảng của toàn bộ mạng. Nếu mạng nền không ổn định, sẽ không có thỏa thuận mức dịch vụ (SLA) nào cho hoạt động kinh doanh. Sau kiến ​​trúc mạng ba lớp và kiến ​​trúc mạng Fat-Tree, kiến ​​trúc mạng trung tâm dữ liệu đang chuyển sang kiến ​​trúc Spine-Leaf, mở ra ứng dụng thứ ba của mô hình mạng CLOS.

Kiến trúc mạng trung tâm dữ liệu truyền thống

Thiết kế ba lớp

Từ năm 2004 đến năm 2007, kiến ​​trúc mạng ba tầng rất phổ biến trong các trung tâm dữ liệu. Nó có ba lớp: lớp lõi (xương sống chuyển mạch tốc độ cao của mạng), lớp tổng hợp (cung cấp kết nối dựa trên chính sách) và lớp truy cập (kết nối các máy trạm với mạng). Mô hình như sau:

Mô hình 3 lớp

Kiến trúc mạng ba lớp

Lớp lõi: Các thiết bị chuyển mạch lõi cung cấp khả năng chuyển tiếp gói tin tốc độ cao ra vào trung tâm dữ liệu, kết nối với nhiều lớp tổng hợp và mạng định tuyến L3 mạnh mẽ thường phục vụ toàn bộ mạng.

Lớp tổng hợp: Bộ chuyển mạch tổng hợp kết nối với bộ chuyển mạch truy cập và cung cấp các dịch vụ khác, chẳng hạn như tường lửa, giảm tải SSL, phát hiện xâm nhập, phân tích mạng, v.v.

Lớp truy cập: Các switch truy cập thường nằm ở phía trên cùng của giá đỡ (Top of Rack), vì vậy chúng còn được gọi là switch ToR (Top of Rack), và chúng kết nối vật lý với các máy chủ.

Thông thường, bộ chuyển mạch tổng hợp là điểm phân định giữa mạng L2 và L3: mạng L2 nằm bên dưới bộ chuyển mạch tổng hợp, và mạng L3 nằm bên trên. Mỗi nhóm bộ chuyển mạch tổng hợp quản lý một Điểm phân phối (POD), và mỗi POD là một mạng VLAN độc lập.

Giao thức vòng lặp mạng và cây bao trùm

Việc hình thành các vòng lặp chủ yếu do sự nhầm lẫn gây ra bởi đường dẫn đích không rõ ràng. Khi người dùng xây dựng mạng, để đảm bảo độ tin cậy, họ thường sử dụng các thiết bị và liên kết dự phòng, do đó các vòng lặp là điều không thể tránh khỏi. Mạng lớp 2 nằm trong cùng một miền phát sóng, và các gói phát sóng sẽ được truyền đi lặp lại trong vòng lặp, tạo thành bão phát sóng, có thể gây tắc nghẽn cổng và làm tê liệt thiết bị ngay lập tức. Do đó, để ngăn chặn bão phát sóng, cần phải ngăn chặn sự hình thành các vòng lặp.

Để ngăn ngừa sự hình thành các vòng lặp và đảm bảo độ tin cậy, chỉ có thể biến các thiết bị và liên kết dự phòng thành các thiết bị và liên kết sao lưu. Tức là, các cổng và liên kết của thiết bị dự phòng bị chặn trong điều kiện bình thường và không tham gia vào việc chuyển tiếp các gói dữ liệu. Chỉ khi thiết bị, cổng hoặc liên kết chuyển tiếp hiện tại bị lỗi, dẫn đến tắc nghẽn mạng, các cổng và liên kết của thiết bị dự phòng mới được mở ra để mạng có thể được khôi phục về trạng thái bình thường. Cơ chế điều khiển tự động này được thực hiện bởi Giao thức Cây bao trùm (STP).

Giao thức cây bao trùm (STP) hoạt động giữa lớp truy cập và lớp đích, và cốt lõi của nó là một thuật toán cây bao trùm chạy trên mỗi cầu nối được kích hoạt STP, được thiết kế đặc biệt để tránh các vòng lặp cầu nối khi có các đường dẫn dư thừa. STP chọn đường dẫn dữ liệu tốt nhất để chuyển tiếp thông báo và không cho phép các liên kết không phải là một phần của cây bao trùm, chỉ để lại một đường dẫn hoạt động giữa bất kỳ hai nút mạng nào và đường dẫn lên còn lại sẽ bị chặn.

Kiến trúc mạng 3 lớp

Giao thức STP có nhiều ưu điểm: đơn giản, dễ sử dụng và yêu cầu cấu hình rất ít. Các máy trong mỗi nhóm (pod) thuộc cùng một VLAN, do đó máy chủ có thể di chuyển vị trí tùy ý trong nhóm mà không cần thay đổi địa chỉ IP và cổng mặc định.

Tuy nhiên, STP không thể sử dụng các đường dẫn chuyển tiếp song song, điều này sẽ luôn vô hiệu hóa các đường dẫn dự phòng trong VLAN. Nhược điểm của STP:

1. Quá trình hội tụ cấu trúc mạng chậm. Khi cấu trúc mạng thay đổi, giao thức cây bao trùm cần 50-52 giây để hoàn tất quá trình hội tụ cấu trúc mạng.

2. Không thể cung cấp chức năng cân bằng tải. Khi có vòng lặp trong mạng, giao thức cây bao trùm chỉ có thể đơn giản là chặn vòng lặp, khiến liên kết không thể chuyển tiếp gói dữ liệu, gây lãng phí tài nguyên mạng.

Ảo hóa và những thách thức về lưu lượng truy cập Đông-Tây

Sau năm 2010, để cải thiện việc sử dụng tài nguyên tính toán và lưu trữ, các trung tâm dữ liệu bắt đầu áp dụng công nghệ ảo hóa, và một lượng lớn máy ảo bắt đầu xuất hiện trên mạng. Công nghệ ảo hóa biến một máy chủ thành nhiều máy chủ logic, mỗi máy ảo có thể chạy độc lập, có hệ điều hành, ứng dụng, địa chỉ MAC và địa chỉ IP riêng, và chúng kết nối với thực thể bên ngoài thông qua bộ chuyển mạch ảo (vSwitch) bên trong máy chủ.

Ảo hóa có một yêu cầu đi kèm: di chuyển trực tiếp các máy ảo, khả năng di chuyển một hệ thống máy ảo từ máy chủ vật lý này sang máy chủ vật lý khác trong khi vẫn duy trì hoạt động bình thường của các dịch vụ trên các máy ảo. Quá trình này không ảnh hưởng đến người dùng cuối, quản trị viên có thể linh hoạt phân bổ tài nguyên máy chủ, hoặc sửa chữa và nâng cấp máy chủ vật lý mà không ảnh hưởng đến việc sử dụng bình thường của người dùng.

Để đảm bảo dịch vụ không bị gián đoạn trong quá trình di chuyển, cần phải duy trì không chỉ địa chỉ IP của máy ảo mà cả trạng thái hoạt động của máy ảo (như trạng thái phiên TCP) trong suốt quá trình di chuyển. Do đó, việc di chuyển động máy ảo chỉ có thể được thực hiện trong cùng một miền lớp 2, chứ không thể di chuyển giữa các miền lớp 2 khác nhau. Điều này tạo ra nhu cầu về các miền L2 lớn hơn từ lớp truy cập đến lớp lõi.

Điểm phân chia giữa L2 và L3 trong kiến ​​trúc mạng lớp 2 truyền thống quy mô lớn nằm ở bộ chuyển mạch lõi, và trung tâm dữ liệu bên dưới bộ chuyển mạch lõi là một miền quảng bá hoàn chỉnh, tức là mạng L2. Bằng cách này, nó có thể thực hiện tính tùy ý trong việc triển khai thiết bị và di chuyển vị trí, và không cần phải sửa đổi cấu hình IP và cổng. Các mạng L2 khác nhau (VLans) được định tuyến thông qua các bộ chuyển mạch lõi. Tuy nhiên, bộ chuyển mạch lõi trong kiến ​​trúc này cần duy trì một bảng MAC và ARP khổng lồ, điều này đặt ra yêu cầu cao về khả năng của bộ chuyển mạch lõi. Ngoài ra, bộ chuyển mạch truy cập (TOR) cũng hạn chế quy mô của toàn bộ mạng. Điều này cuối cùng hạn chế quy mô của mạng, khả năng mở rộng và tính linh hoạt của mạng, vấn đề độ trễ khi lập lịch trên ba lớp, không thể đáp ứng nhu cầu kinh doanh trong tương lai.

Mặt khác, lưu lượng truy cập Đông-Tây do công nghệ ảo hóa mang lại cũng đặt ra những thách thức cho mạng ba lớp truyền thống. Lưu lượng truy cập trung tâm dữ liệu có thể được chia thành các loại chính sau:

Giao thông theo hướng Bắc-Nam:Lưu lượng truy cập giữa các máy khách bên ngoài trung tâm dữ liệu và máy chủ trung tâm dữ liệu, hoặc lưu lượng truy cập từ máy chủ trung tâm dữ liệu đến Internet.

Giao thông Đông-Tây:Lưu lượng truy cập giữa các máy chủ trong cùng một trung tâm dữ liệu, cũng như lưu lượng truy cập giữa các trung tâm dữ liệu khác nhau, chẳng hạn như khôi phục dữ liệu sau sự cố giữa các trung tâm dữ liệu, giao tiếp giữa các đám mây riêng và đám mây công cộng.

Việc ứng dụng công nghệ ảo hóa khiến việc triển khai ứng dụng ngày càng phân tán, và "tác dụng phụ" là lưu lượng truy cập Đông-Tây ngày càng tăng.

Các kiến ​​trúc ba tầng truyền thống thường được thiết kế cho giao thông theo hướng Bắc-Nam.Mặc dù có thể sử dụng cho giao thông đông-tây, nhưng cuối cùng nó có thể không hoạt động như yêu cầu.

 Kiến trúc ba tầng truyền thống

Kiến trúc ba tầng truyền thống so với kiến ​​trúc dạng xương sống-lá.

Trong kiến ​​trúc ba tầng, lưu lượng truy cập đông-tây phải được chuyển tiếp qua các thiết bị ở tầng tổng hợp và tầng lõi. Điều này dẫn đến việc phải đi qua nhiều nút không cần thiết. (Máy chủ -> Truy cập -> Tổng hợp -> Bộ chuyển mạch lõi -> Tổng hợp -> Bộ chuyển mạch truy cập -> Máy chủ)

Do đó, nếu một lượng lớn lưu lượng truy cập đông-tây được truyền qua kiến ​​trúc mạng ba tầng truyền thống, các thiết bị kết nối với cùng một cổng chuyển mạch có thể cạnh tranh băng thông, dẫn đến thời gian phản hồi kém đối với người dùng cuối.

Nhược điểm của kiến ​​trúc mạng ba lớp truyền thống

Như vậy, có thể thấy kiến ​​trúc mạng ba lớp truyền thống có nhiều nhược điểm:

Lãng phí băng thông:Để ngăn chặn hiện tượng vòng lặp, giao thức STP thường được chạy giữa lớp tổng hợp và lớp truy cập, sao cho chỉ có một đường truyền lên của bộ chuyển mạch truy cập thực sự truyền tải lưu lượng, và các đường truyền lên khác sẽ bị chặn, dẫn đến lãng phí băng thông.

Khó khăn trong việc triển khai mạng lưới quy mô lớn:Với sự mở rộng quy mô mạng, các trung tâm dữ liệu được phân bố ở nhiều vị trí địa lý khác nhau, các máy ảo phải được tạo và di chuyển đến bất cứ đâu, và các thuộc tính mạng của chúng như địa chỉ IP và cổng mặc định vẫn không thay đổi, điều này đòi hỏi sự hỗ trợ của lớp 2 mạnh mẽ. Trong cấu trúc truyền thống, việc di chuyển không thể thực hiện được.

Thiếu lưu lượng giao thông Đông-Tây:Kiến trúc mạng ba tầng chủ yếu được thiết kế cho lưu lượng Bắc-Nam, mặc dù nó cũng hỗ trợ lưu lượng Đông-Tây, nhưng nhược điểm là rõ ràng. Khi lưu lượng Đông-Tây lớn, áp lực lên các thiết bị chuyển mạch ở lớp tổng hợp và lớp lõi sẽ tăng lên đáng kể, và kích thước cũng như hiệu năng mạng sẽ bị giới hạn ở lớp tổng hợp và lớp lõi.

Điều này khiến các doanh nghiệp rơi vào tình thế tiến thoái lưỡng nan về chi phí và khả năng mở rộng:Việc hỗ trợ các mạng hiệu năng cao quy mô lớn đòi hỏi một lượng lớn thiết bị lớp hội tụ và lớp lõi, điều này không chỉ gây ra chi phí cao cho doanh nghiệp mà còn yêu cầu phải lập kế hoạch trước khi xây dựng mạng. Khi quy mô mạng nhỏ, sẽ gây lãng phí tài nguyên, và khi quy mô mạng tiếp tục mở rộng, việc mở rộng sẽ khó khăn hơn.

Kiến trúc mạng gai-lá
Kiến trúc mạng Spine-Leaf là gì?
Để giải quyết những vấn đề nêu trên,Một thiết kế trung tâm dữ liệu mới, kiến ​​trúc mạng Spine-Leaf, đã xuất hiện, mà chúng ta gọi là mạng leaf ridge.
Như tên gọi cho thấy, kiến ​​trúc này có lớp Spine và lớp Leaf, bao gồm các switch Spine và switch Leaf.

 Kiến trúc mạng gai-lá

Cấu trúc gai-lá

Mỗi công tắc lá được kết nối với tất cả các công tắc gờ, nhưng các công tắc gờ này không được kết nối trực tiếp với nhau, tạo thành cấu trúc mạng lưới hoàn chỉnh.
Trong kiến ​​trúc spine-and-leaf, kết nối từ máy chủ này đến máy chủ khác sẽ đi qua cùng số lượng thiết bị (Máy chủ -> Lá -> Bộ chuyển mạch Spine -> Bộ chuyển mạch Leaf -> Máy chủ), điều này đảm bảo độ trễ có thể dự đoán được. Bởi vì một gói tin chỉ cần đi qua một bộ chuyển mạch spine và một bộ chuyển mạch leaf để đến đích.

Spine-Leaf hoạt động như thế nào?
Switch lá (Leaf Switch): Nó tương đương với switch truy cập trong kiến ​​trúc ba tầng truyền thống và kết nối trực tiếp với máy chủ vật lý như TOR (Top Of Rack). Điểm khác biệt so với switch truy cập là điểm phân định mạng L2/L3 nằm trên switch lá. Switch lá nằm trên mạng lớp 3 và dưới miền broadcast L2 độc lập, giải quyết vấn đề BUM (Background Overload) của mạng lớp 2 lớn. Nếu hai máy chủ Leaf cần giao tiếp, chúng cần sử dụng định tuyến L3 và chuyển tiếp thông qua switch xương sống (Spine Switch).
Switch Spine: Tương đương với switch lõi. Giao thức ECMP (Equal Cost Multi Path) được sử dụng để tự động chọn nhiều đường dẫn giữa switch Spine và switch Leaf. Điểm khác biệt là switch Spine giờ đây chỉ đơn giản cung cấp mạng định tuyến L3 dự phòng cho switch Leaf, do đó lưu lượng truy cập bắc-nam của trung tâm dữ liệu có thể được định tuyến từ switch Spine thay vì trực tiếp. Lưu lượng truy cập bắc-nam có thể được định tuyến từ switch biên song song với switch Leaf đến bộ định tuyến WAN.

 Kiến trúc mạng dạng gai-lá so với kiến ​​trúc mạng ba lớp truyền thống

So sánh giữa kiến ​​trúc mạng Spine/Leaf và kiến ​​trúc mạng ba lớp truyền thống

Ưu điểm của lá gai
Phẳng:Thiết kế phẳng giúp rút ngắn đường dẫn giao tiếp giữa các máy chủ, dẫn đến độ trễ thấp hơn, từ đó có thể cải thiện đáng kể hiệu suất ứng dụng và dịch vụ.
Khả năng mở rộng tốt:Khi băng thông không đủ, việc tăng số lượng switch nhánh có thể mở rộng băng thông theo chiều ngang. Khi số lượng máy chủ tăng lên, chúng ta có thể thêm switch lá nếu mật độ cổng không đủ.
Giảm chi phí: Lưu lượng truy cập hướng Bắc và hướng Nam, xuất phát từ các nút lá hoặc các nút đỉnh. Luồng giao thông Đông-Tây được phân bổ trên nhiều đường dẫn. Bằng cách này, mạng lưới nút lá-đỉnh có thể sử dụng các bộ chuyển mạch cấu hình cố định mà không cần đến các bộ chuyển mạch mô-đun đắt tiền, từ đó giảm chi phí.
Độ trễ thấp và tránh tắc nghẽn:Luồng dữ liệu trong mạng Leafridge có cùng số bước nhảy trên toàn mạng bất kể nguồn và đích, và bất kỳ hai máy chủ nào cũng có thể truy cập được từ Leaf -> Spine -> Leaf với ba bước nhảy. Điều này thiết lập một đường dẫn lưu lượng trực tiếp hơn, giúp cải thiện hiệu suất và giảm tắc nghẽn.
Độ bảo mật và tính sẵn sàng cao:Giao thức STP được sử dụng trong kiến ​​trúc mạng ba tầng truyền thống, và khi một thiết bị gặp sự cố, nó sẽ thực hiện quá trình hội tụ lại, ảnh hưởng đến hiệu suất mạng hoặc thậm chí gây ra lỗi. Trong kiến ​​trúc leaf-ridge, khi một thiết bị gặp sự cố, không cần phải hội tụ lại, và lưu lượng truy cập tiếp tục đi qua các đường dẫn bình thường khác. Khả năng kết nối mạng không bị ảnh hưởng, và băng thông chỉ bị giảm đi một đường dẫn, với tác động hiệu suất rất nhỏ.
Cân bằng tải thông qua ECMP rất phù hợp với môi trường sử dụng các nền tảng quản lý mạng tập trung như SDN. SDN cho phép đơn giản hóa việc cấu hình, quản lý và định tuyến lại lưu lượng truy cập trong trường hợp tắc nghẽn hoặc lỗi liên kết, giúp cho cấu trúc liên kết mạng lưới đầy đủ cân bằng tải thông minh trở nên tương đối dễ cấu hình và quản lý.

Tuy nhiên, kiến ​​trúc Spine-Leaf có một số hạn chế:
Một nhược điểm là số lượng switch làm tăng kích thước mạng. Trung tâm dữ liệu với kiến ​​trúc mạng dạng lá-rãnh cần tăng số lượng switch và thiết bị mạng tỷ lệ thuận với số lượng máy khách. Khi số lượng máy chủ tăng lên, cần một số lượng lớn switch lá để kết nối với switch rãnh.
Việc kết nối trực tiếp giữa các switch nhánh và switch lá đòi hỏi phải có sự tương thích, và nhìn chung, tỷ lệ băng thông hợp lý giữa các switch nhánh và switch lá không thể vượt quá 3:1.
Ví dụ, có 48 máy khách tốc độ 10Gbps trên switch lá với tổng dung lượng cổng là 480Gb/s. Nếu bốn cổng uplink 40G của mỗi switch lá được kết nối với switch đỉnh 40G, nó sẽ có dung lượng uplink là 160Gb/s. Tỷ lệ là 480:160, hay 3:1. Các đường uplink trong trung tâm dữ liệu thường là 40G hoặc 100G và có thể được nâng cấp dần theo thời gian từ điểm xuất phát là 40G (Nx 40G) lên 100G (Nx 100G). Điều quan trọng cần lưu ý là đường uplink luôn phải nhanh hơn đường downlink để không làm tắc nghẽn liên kết cổng.

 Tỷ lệ băng thông chuyển mạch Spine-Leaf

Mạng Spine-Leaf cũng có những yêu cầu rõ ràng về đường dây. Vì mỗi nút lá phải được kết nối với mỗi switch xương sống, chúng ta cần phải lắp đặt nhiều cáp đồng hoặc cáp quang hơn. Khoảng cách kết nối càng lớn thì chi phí càng cao. Tùy thuộc vào khoảng cách giữa các switch được kết nối, số lượng module quang cao cấp cần thiết cho kiến ​​trúc Spine-Leaf cao hơn hàng chục lần so với kiến ​​trúc ba tầng truyền thống, điều này làm tăng tổng chi phí triển khai. Tuy nhiên, điều này đã dẫn đến sự phát triển của thị trường module quang, đặc biệt là các module quang tốc độ cao như 100G và 400G.


Thời gian đăng bài: 26/01/2026