OpenAI ký thỏa thuận nhiều tỷ USD với Cerebras Systems để mua tối đa 750 MW năng lực tính toán trong 3 năm, nhằm tăng tốc suy luận (inference) độ trễ thấp cho các sản phẩm AI.
Trong bối cảnh nhu cầu AI bùng nổ và thiếu hụt năng lực tính toán, OpenAI đang đa dạng hóa nguồn cung phần cứng, đồng thời mở rộng hạ tầng năng lượng – trung tâm dữ liệu để phục vụ suy luận thời gian thực, từ trả lời câu hỏi khó đến chạy AI agent.
- OpenAI sẽ mua tối đa 750 MW compute từ Cerebras trong 3 năm để tăng tốc suy luận độ trễ thấp.
- OpenAI hợp tác với SB Energy (SoftBank) và cùng SoftBank cam kết 500 triệu USD mỗi bên đầu tư vào SB Energy.
- Cộng đồng địa phương phản đối trung tâm dữ liệu do tiếng ồn và tiêu thụ nước, buộc doanh nghiệp phải tối ưu vận hành và hạ tầng.
OpenAI tích hợp Cerebras để tăng tốc suy luận AI độ trễ thấp
OpenAI cho biết việc đưa Cerebras vào danh mục giải pháp compute nhằm giúp mô hình phản hồi nhanh hơn, hỗ trợ tương tác tự nhiên và mở rộng AI thời gian thực cho nhiều người dùng hơn.
Cerebras Systems là startup chip AI xây dựng hệ thống “đo ni đóng giày” cho tác vụ AI, tập trung tăng tốc các đầu ra dài. Họ cho rằng tốc độ đến từ việc ghép năng lực tính toán, bộ nhớ và băng thông lớn trên một chip “khổng lồ”, giảm nút thắt khiến suy luận chậm trên phần cứng truyền thống.
OpenAI muốn tận dụng đặc tính độ trễ thấp này để cải thiện trải nghiệm khi người dùng đặt câu hỏi khó, tạo mã, tạo ảnh hoặc chạy AI agent. Mục tiêu được mô tả là phản hồi gần thời gian thực để người dùng làm được nhiều việc hơn và chạy các khối lượng công việc có giá trị cao hơn.
Theo tuyên bố, OpenAI sẽ đưa năng lực độ trễ thấp này vào “inference stack” theo từng giai đoạn, mở rộng dần trên nhiều loại workload. Năng lực compute dự kiến được đưa vào hoạt động theo nhiều đợt và kéo dài đến năm 2028.
“Cerebras bổ sung một giải pháp suy luận chuyên dụng, độ trễ thấp cho nền tảng của chúng tôi. Điều đó đồng nghĩa phản hồi nhanh hơn, tương tác tự nhiên hơn và nền tảng vững chắc hơn để mở rộng AI thời gian thực tới nhiều người hơn.”
– Sachin Katti, OpenAI
Thỏa thuận 750 MW phản ánh áp lực thiếu compute và chiến lược giảm phụ thuộc nhà cung cấp lớn
Thỏa thuận mua tối đa 750 MW trong 3 năm cho thấy OpenAI đang chịu áp lực từ nhu cầu tăng mạnh và tình trạng khan hiếm compute, đồng thời tìm cách đa dạng hóa ngoài các nhà cung cấp và hệ sinh thái phần cứng hiện tại.
OpenAI mô tả định hướng “danh mục compute bền vững”, tức ghép đúng hệ thống cho đúng workload để tăng khả năng chống chịu. Trong bối cảnh đó, Cerebras được đưa vào như một lựa chọn cho suy luận độ trễ thấp, cạnh tranh bằng tốc độ và tính chuyên dụng.
Diễn biến này cũng thu hút chú ý vì Sam Altman được nhắc đến như một nhà đầu tư của Cerebras Systems. Song song, OpenAI được cho là đang tìm cách giảm mức phụ thuộc lớn vào Nvidia và các nhà cung cấp cloud quy mô lớn như Microsoft và Oracle.
Cerebras kỳ vọng suy luận thời gian thực sẽ thay đổi cách con người tương tác với AI
Lãnh đạo Cerebras cho rằng suy luận thời gian thực sẽ tạo ra những cách xây dựng và tương tác với mô hình AI hoàn toàn mới, tương tự cách băng thông rộng từng thay đổi internet.
Andrew Feldman, đồng sáng lập kiêm CEO Cerebras, nói hợp tác này là cơ hội ghép “các mô hình AI hàng đầu” với “bộ xử lý AI nhanh nhất”. Ông nhấn mạnh suy luận thời gian thực có thể nâng cấp trải nghiệm AI, đặc biệt với các tác vụ cần phản hồi ngay.
Phát biểu của Feldman được dẫn trong thông báo hợp tác chính thức của OpenAI. Chi tiết xem tại thông báo hợp tác OpenAI – Cerebras.
OpenAI hợp tác SB Energy (SoftBank) để mở rộng hạ tầng AI và năng lượng tại Mỹ
OpenAI công bố hợp tác chiến lược với SB Energy, công ty thuộc SoftBank Group, trong khuôn khổ dự án Stargate, nhằm phát triển hạ tầng AI và năng lượng thế hệ mới tại Mỹ.
Để đáp ứng nhu cầu compute AI tăng tốc, OpenAI và SoftBank Group mỗi bên cam kết 500 triệu USD, khoản này sẽ được đầu tư vào SB Energy. Thông tin được nêu trong thông báo hợp tác OpenAI – SB Energy.
OpenAI cũng chọn SBE xây dựng và vận hành địa điểm trung tâm dữ liệu 1,2 GW đã công bố trước đó tại Milam County. Khoản đầu tư vốn chủ sở hữu nhằm hỗ trợ tăng trưởng của SB Energy khi phát triển các “campus” trung tâm dữ liệu đa gigawatt, dự kiến bắt đầu cung cấp dịch vụ trong năm nay.
Milam County Data Center nhấn mạnh cam kết việc làm, hiện đại hóa lưới điện và giảm dùng nước
Dự án tại Milam County được kỳ vọng tạo hàng nghìn việc làm xây dựng, đồng thời được thiết kế để giảm sử dụng nước và hạn chế tác động lên người trả tiền điện tại Texas.
Theo tuyên bố, mỗi dự án sẽ có phần đầu tư cho cộng đồng thông qua việc làm có thu nhập tốt, phát triển lực lượng lao động và hiện đại hóa lưới điện, với mục tiêu tạo tăng trưởng kinh tế bền vững cho các khu vực đối tác.
Trung tâm dữ liệu Milam County cũng được nói là có kế hoạch đáp ứng nhu cầu năng lượng của chính dự án trong khi vẫn bảo vệ lợi ích người dân Texas về chi phí điện. Đây là các điểm thường được nhắc tới khi quy mô trung tâm dữ liệu tăng nhanh.
Phản đối trung tâm dữ liệu gia tăng vì tiếng ồn và tiêu thụ nước
Nhiều cộng đồng địa phương phản đối trung tâm dữ liệu do lo ngại ô nhiễm tiếng ồn và mức tiêu thụ nước, tạo áp lực buộc các công ty phải thay đổi thiết kế và cam kết lợi ích kinh tế rõ ràng.
Văn bản nêu OpenAI nhận thức được sự khó chịu ngày càng tăng của cư dân sống xung quanh các trung tâm dữ liệu. Năm 2025 ghi nhận sự lan rộng của phong trào “Not-in-my-backyard (NIMBY)” khi ngày càng nhiều người kêu gọi dừng hoặc ngăn xây các cơ sở bị cho là gây ảnh hưởng đến khu dân cư.
Một ví dụ về diễn biến dư luận được đề cập qua bài viết tại NPR về người dân phản đối trung tâm dữ liệu. Nội dung nhấn mạnh các phàn nàn xoay quanh tiếng ồn và tài nguyên nước.
Đáp lại, doanh nghiệp đang tìm giải pháp như làm mát bằng chất lỏng để thay thế hệ thống HVAC ồn ào, cùng các cam kết về tăng trưởng kinh tế dài hạn cho địa phương. Dù vậy, mức độ hoài nghi vẫn cao và một bộ phận cư dân trực tiếp phản đối các dự án mới.
Những câu hỏi thường gặp
OpenAI sẽ mua bao nhiêu năng lực tính toán từ Cerebras và trong bao lâu?
OpenAI dự kiến mua tối đa 750 MW năng lực tính toán từ Cerebras Systems trong vòng 3 năm, và năng lực này được kỳ vọng đưa vào hoạt động theo nhiều đợt đến năm 2028.
Vì sao Cerebras được xem là phù hợp cho suy luận AI độ trễ thấp?
Cerebras xây hệ thống chip AI chuyên dụng, ghép compute, bộ nhớ và băng thông lớn trên một chip khổ lớn để giảm nút thắt, từ đó tăng tốc suy luận và cải thiện tốc độ phản hồi cho các tác vụ thời gian thực.
OpenAI và SoftBank đầu tư bao nhiêu vào SB Energy?
OpenAI và SoftBank Group mỗi bên cam kết 500 triệu USD để đầu tư vào SB Energy, nhằm hỗ trợ phát triển hạ tầng năng lượng và trung tâm dữ liệu phục vụ nhu cầu compute AI.
Trung tâm dữ liệu 1,2 GW của OpenAI đặt ở đâu?
Địa điểm trung tâm dữ liệu 1,2 GW được nêu là tại Milam County, và OpenAI đã chọn SBE (SB Energy) để xây dựng và vận hành địa điểm này.
Vì sao cộng đồng địa phương phản đối trung tâm dữ liệu?
Các lo ngại chính được nêu gồm tiếng ồn (từ hạ tầng làm mát như HVAC) và mức tiêu thụ nước. Điều này thúc đẩy phong trào phản đối kiểu NIMBY tại một số khu vực.
