Microsoft ra mắt chip AI Maia 200 để thúc đẩy mảng cloud

Microsoft ra mắt chip AI thế hệ 2 Maia 200 nhằm giảm phụ thuộc vào GPU Nvidia và tăng sức cạnh tranh của Azure trong các tác vụ suy luận AI.

Nhu cầu năng lực tính toán AI tăng mạnh buộc các nhà cung cấp đám mây phải tối ưu đồng thời hiệu năng, chi phí và điện năng. Trong bối cảnh doanh nghiệp ưu tiên triển khai AI vào vận hành thực tế hơn là huấn luyện mô hình, chip chuyên cho suy luận trở thành tâm điểm chiến lược hạ tầng.

NỘI DUNG CHÍNH
  • Maia 200 là chip AI thế hệ 2 của Microsoft, nhắm tới suy luận và triển khai nội bộ để tối ưu chi phí hạ tầng đám mây.
  • Microsoft quảng bá Maia 200 là hệ thống suy luận hiệu quả nhất hãng từng xây dựng, định vị đối trọng với Nvidia.
  • Chip dùng tiến trình 3 nm của TSMC, bắt đầu triển khai tại trung tâm dữ liệu miền trung Mỹ trước khi mở rộng sang các khu vực khác.

Maia 200 giúp Microsoft giảm phụ thuộc vào Nvidia trong hạ tầng AI

Maia 200 được Microsoft định vị là lựa chọn thay thế để bớt lệ thuộc vào bộ xử lý Nvidia, qua đó kiểm soát chi phí khi cần lượng lớn năng lực tính toán AI trên Azure.

Microsoft xem Maia 200 là thành phần quan trọng trong chiến lược chip và điện toán đám mây, nhằm cạnh tranh với lợi thế xử lý của Nvidia. Scott Guthrie, Phó chủ tịch điều hành phụ trách Cloud & AI của Microsoft, cho biết Maia 200 là “hệ thống suy luận hiệu quả nhất mà Microsoft từng xây dựng”.

Một nhà phân tích có kinh nghiệm môi trường hyperscale nhận định việc phát triển chip Maia lẽ ra nên làm sớm hơn. Lý do là các nhà cung cấp đám mây cần công nghệ chip sở hữu riêng để giữ chi phí thấp khi dùng nhiều sức mạnh xử lý, thay vì liên tục thuê tài nguyên từ Nvidia.

Đọc thêm:  Công ty Anh hứa taxi bay giá như Uber Black vào 2028

Một tư vấn viên đám mây cũng nêu quan điểm rằng để các nhà cung cấp đám mây lớn nhất duy trì năng lực cạnh tranh, họ phải phát triển công nghệ chip tùy biến.

Trước đó, Microsoft từng giới thiệu Azure Maia 100 và Cobalt 100 vào năm 2023 như bước đi đầu tiên trong hành trình sản xuất bán dẫn AI phục vụ Azure. Hiện Microsoft tiếp tục phát triển các phiên bản kế nhiệm, thể hiện cam kết theo đuổi dài hạn trong lĩnh vực AI và bán dẫn.

Maia 200 tập trung tối ưu suy luận AI bằng tiến trình 3 nm

Maia 200 được sản xuất trên tiến trình 3 nm của TSMC và nhắm vào tác vụ suy luận, phù hợp xu hướng doanh nghiệp triển khai AI vào sản phẩm thay vì huấn luyện mô hình.

Microsoft cho biết Maia 200 hướng tới “inference workloads” và được chế tạo bằng công nghệ 3 nm của Taiwan Semiconductor Manufacturing Company. Khi ngày càng nhiều doanh nghiệp ưu tiên ứng dụng AI thay vì chỉ tập trung huấn luyện, mảng suy luận trở thành thị trường tăng nhanh.

Theo Microsoft, Maia 200 có hiệu năng tốt hơn 30% so với các bộ xử lý tương tự trên thị trường và có thể xử lý nhiều bộ nhớ băng thông cao hơn giải pháp của Amazon hoặc Google. Một kỹ sư của Microsoft nhấn mạnh hiệu suất suy luận là nơi biên lợi nhuận của mảng đám mây được quyết định; tiêu thụ điện thấp hơn sẽ giúp cải thiện khả năng sinh lời.

Đọc thêm:  Trump cam kết Big Tech sẽ trả chi phí điện cho trung tâm dữ liệu

Hệ sinh thái Arm hỗ trợ Microsoft phát triển silicon tùy biến cho trung tâm dữ liệu

Microsoft hợp tác với Arm để đơn giản hóa việc phát triển silicon tùy biến cho trung tâm dữ liệu, tập trung vào các hệ sinh thái như Neoverse CSS và Total Design.

Microsoft cho biết quá trình này có sự phối hợp với Arm, nhằm tạo “con đường” thuận lợi hơn để phát triển các giải pháp silicon tùy biến. Trong đó, Arm Neoverse CSS và hệ sinh thái Arm Total Design là trọng tâm, giúp giảm độ phức tạp khi cung cấp các giải pháp chuyên biệt cho trung tâm dữ liệu và hạ tầng mạng.

Maia 200 sẽ được triển khai cho Copilot và các dịch vụ AI của Microsoft

Microsoft dự kiến dùng Maia 200 cho nhóm superintelligence, Microsoft 365 Copilot và Foundry AI, bắt đầu triển khai tại trung tâm dữ liệu miền trung Mỹ rồi mở rộng tiếp.

Việc đưa Maia 200 vào các sản phẩm và nhóm nội bộ như Microsoft 365 Copilot và Foundry AI được kỳ vọng giúp Microsoft nâng chất lượng dịch vụ đám mây, đồng thời tiếp cận tốt hơn nhóm khách hàng hiện tại và tiềm năng. Kế hoạch triển khai sẽ khởi động tại các trung tâm dữ liệu ở miền trung nước Mỹ trước, sau đó mở rộng sang các địa điểm khác.

Một lập trình viên phần mềm thử nghiệm sớm Maia 200 cho rằng mức độ “được dùng thật” sẽ quyết định thành công, nhấn mạnh: “Bài kiểm tra cuối cùng là liệu nó có giúp khách hàng thực sự dùng sản phẩm ở quy mô lớn hay không.”

“Bài kiểm tra cuối cùng là liệu nó có giúp khách hàng thực sự dùng sản phẩm ở quy mô lớn hay không.”
– Nhà phát triển phần mềm (thử nghiệm sớm Maia 200)

Những câu hỏi thường gặp

Maia 200 của Microsoft dùng để làm gì?

Maia 200 là chip AI tập trung vào tác vụ suy luận (inference), phục vụ triển khai AI trong vận hành và sản phẩm. Microsoft dự kiến dùng chip này trong các dịch vụ và nhóm nội bộ như Microsoft 365 Copilot, Foundry AI và các hệ thống AI quy mô lớn.

Đọc thêm:  Circle hợp tác Polymarket tăng cường hạ tầng dự đoán

Vì sao Microsoft cần chip Maia 200 thay vì chỉ dùng Nvidia?

Mục tiêu là giảm phụ thuộc vào nguồn cung GPU và tối ưu chi phí khi cần sức mạnh xử lý lớn. Tự phát triển chip giúp nhà cung cấp đám mây chủ động hơn về chi phí, hiệu năng và điện năng trong trung tâm dữ liệu.

Maia 200 được sản xuất bằng công nghệ nào?

Microsoft cho biết Maia 200 được sản xuất trên tiến trình 3 nm của TSMC. Chip được thiết kế hướng tới hiệu quả suy luận và tối ưu mức tiêu thụ điện cho môi trường trung tâm dữ liệu.

Khi nào Maia 200 được triển khai trong trung tâm dữ liệu?

Kế hoạch triển khai Maia 200 bắt đầu tại các trung tâm dữ liệu miền trung nước Mỹ, sau đó mở rộng sang các địa điểm khác. Bài viết không nêu mốc thời gian cụ thể theo ngày.

More like this

Australia vươn lên trung tâm AI nhờ bùng nổ data center 105 tỷ USD

Australia vươn lên trung tâm AI nhờ bùng nổ...

Australia đặt mục tiêu mở rộng gần 6 gigawatt (GW) công suất trung tâm dữ liệu trị...
Vì sao cổ phiếu Samsung tăng mạnh hôm nay?

Vì sao cổ phiếu Samsung tăng mạnh hôm nay?

Cổ phiếu Samsung tăng hơn 6% sau khi xuất hiện thông tin hãng sắp sản xuất hàng...
CoinShares: Mối đe dọa lượng tử với Bitcoin bị thổi phồng

CoinShares: Mối đe dọa lượng tử với Bitcoin bị...

CoinShares nhận định rủi ro máy tính lượng tử đối với Bitcoin đang bị phóng đại và...