NVIDIA được cho là đang phát triển chip AI suy luận, OpenAI có thể trở thành khách hàng lớn nhất

2026-02-28 09:25:44

Tài Lián Xè 28 tháng 2 (Biên tập: Xia Junxiong) Theo nguồn tin từ truyền thông dẫn lời các nhân vật thân cận, tập đoàn chip khổng lồ NVIDIA dự định ra mắt một bộ xử lý hoàn toàn mới, dành riêng cho các công ty nghiên cứu trí tuệ nhân tạo (AI) như OpenAI và các khách hàng khác, nhằm giúp họ xây dựng các công cụ nhanh hơn, hiệu quả hơn.

Nguồn tin cho biết, NVIDIA đang thiết kế một hệ thống tính toán suy luận mới. Nền tảng này dự kiến sẽ được giới thiệu tại Hội nghị nhà phát triển NVIDIA GTC diễn ra vào tháng tới tại San Jose, và sẽ tích hợp các chip do startup Groq thiết kế.

Tính toán suy luận là phương thức xử lý cho phép mô hình AI phản hồi các câu hỏi của người dùng, đã trở thành tâm điểm cạnh tranh gay gắt trong ngành. Các công ty như Google và Amazon đã thiết kế các chip cạnh tranh với hệ thống hàng đầu của NVIDIA.

Ngoài ra, sự phát triển nhanh chóng của tự động hóa lập trình trong ngành công nghệ cũng thúc đẩy nhu cầu về các loại chip mới, cần xử lý các nhiệm vụ liên quan đến AI phức tạp một cách hiệu quả hơn.

Nguồn tin cho biết, OpenAI đã đồng ý trở thành một trong những khách hàng lớn nhất của bộ xử lý mới này, điều này là một chiến thắng lớn đối với NVIDIA.

Là một trong những khách hàng lớn nhất của NVIDIA, trong vài tháng qua, OpenAI đã tìm kiếm các giải pháp thay thế hiệu quả hơn so với chip của NVIDIA, và tháng trước đã ký hợp đồng với startup chip Cerebras để mở rộng lựa chọn của mình.

Thách thức tiềm năng của GPU NVIDIA

NVIDIA đã thống trị thị trường GPU (bộ xử lý đồ họa) trong thời gian dài. Các nhà phân tích ước tính, NVIDIA kiểm soát hơn 90% thị phần GPU.

GPU là loại xử lý có khả năng thực hiện hàng tỷ nhiệm vụ đơn giản cùng lúc.

Các dòng GPU như Hopper, Blackwell và Rubin của NVIDIA được xem là tiêu chuẩn ngành trong việc huấn luyện các mô hình AI siêu lớn, với mức giá cao.

Tuy nhiên, kể từ khi làn sóng AI bùng nổ, NVIDIA lần đầu tiên đối mặt với giới hạn của các sản phẩm hàng đầu của mình. Khi trọng tâm thị trường chuyển từ huấn luyện sang suy luận, một số khách hàng bắt đầu gây áp lực yêu cầu NVIDIA phát triển các chip thúc đẩy AI hiệu quả hơn.

Trong năm qua, khi các doanh nghiệp triển khai AI agent và các công cụ khác, nhu cầu về sức mạnh tính toán cao cấp đã chuyển từ huấn luyện sang suy luận. AI agent là hệ thống có khả năng thực hiện nhiệm vụ thay mặt người dùng một cách tương đối tự chủ.

Nhiều công ty xây dựng và vận hành AI agent nhận thấy, chi phí GPU quá cao, tiêu thụ năng lượng lớn, và không phải là lựa chọn tối ưu trong vận hành thực tế. Cùng với sự trỗi dậy nhanh chóng của “AI đại lý” (agentic AI), NVIDIA đang đối mặt với áp lực phát triển các chip suy luận có chi phí thấp hơn, hiệu năng cao hơn.

Tháng trước, OpenAI đã ký hợp đồng hợp tác tính toán trị giá hàng tỷ USD với Cerebras. Công ty này cung cấp chip tập trung vào suy luận, tự nhận mình nhanh hơn GPU của NVIDIA.

Đối với NVIDIA, chip xử lý tensor (TPU) do Google tự phát triển cũng là một thách thức quan trọng. Thực tế, Google đang thúc đẩy kế hoạch để TPU có thể thay thế GPU.

Để củng cố lợi thế cạnh tranh, cuối năm ngoái NVIDIA đã đồng ý trả 200 tỷ USD để cấp phép công nghệ chủ chốt của Groq, đồng thời tuyển dụng đội ngũ cao cấp của họ, bao gồm cả nhà sáng lập Jonathan Ross. Đây là một trong những thương vụ “mua bán nhân tài” (acqui-hire) lớn nhất lịch sử Silicon Valley.

Các chip do Groq thiết kế sử dụng kiến trúc khác với của NVIDIA, gọi là “đơn vị xử lý ngôn ngữ” (Language Processing Units), có hiệu quả cao trong chức năng suy luận. Tuy nhiên, NVIDIA đến nay vẫn chưa công bố rõ ràng cách họ sẽ ứng dụng công nghệ của Groq.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.