GPU là thành phần cơ bản trong việc phát triển các mô hình ngôn ngữ lớn làm nền tảng cho các công cụ trí tuệ nhân tạo (AI) gây sốt như ChatGPT.
Theo tờ Financial Times, Nvidia (hãng chip có giá trị lớn nhất thế giới) muốn tăng cường sản xuất H100 - mẫu GPU đang được săn lùng ráo riết. Cụ thể hơn, công ty Mỹ đặt mục tiêu xuất xưởng từ 1,5 triệu đến 2 triệu chiếc H100 vào 2024, tăng so với mục tiêu 500.000 chiếc trong năm nay.
Vốn hóa thị trường của Nvidia đã tăng vọt lên hơn 1.000 tỉ USD vào tháng 5 khi các công ty AI đổ xô mua GPU. Tầm quan trọng của GPU với sự bùng nổ AI đã dẫn đến việc các công ty và quốc gia chạy đua để mua thiết bị này. Đầu tháng 8, tờ Financial Times đưa tin rằng Ả Rập Saudi và UAE đã mua hàng ngàn H100 của Nvidia.
Các nhà đầu tư mạo hiểm giàu có đua nhau mua GPU cho các công ty khởi nghiệp trong danh mục đầu tư đang tìm cách xây dựng các mô hình AI riêng được đào tạo dựa trên dữ liệu mà họ sử dụng.
Vào tháng 6, Reuters đưa tin GPU của Nvidia đã trở nên phổ biến đến mức các công ty Trung Quốc sẵn sàng mua chúng thông qua các thị trường ngầm ở Hồng Kông, khi các quy định xuất khẩu của Mỹ cấm Nvidia bán GPU cao cấp nhất của họ cho Trung Quốc.
Trong quý 1/2023, Nvidia công bố doanh thu tăng vọt 19% lên 7,2 tỉ USD so với quý trước. Giám đốc điều hành Nvidia - Jensen Huang cho biết công ty đang "tăng đáng kể nguồn cung để đáp ứng nhu cầu ngày càng tăng" với các sản phẩm như H100.
Nvidia công bố mức doanh thu đột phá ở quý 2/2023
Nvidia vừa công bố mức doanh thu đột phá trong quý 2/2023 và dự báo doanh thu thậm chí còn cao hơn ở quý 3.
Trong cuộc gọi báo cáo kết quả kinh doanh hôm 23.8, Nvidia cho biết doanh thu quý 2/2023 của hãng là 13,51 tỉ USD, tăng 88% so với quý trước và tăng 101% so với cùng kỳ năm trước. Doanh thu khổng lồ phản ánh sự gia tăng chi tiêu trong lĩnh vực AI từ các khách hàng lớn nhất của Nvidia, như Google Cloud, Meta Platforms và Oracle.
Nvidia dự kiến doanh thu trong quý 3/2023 khoảng 16 tỉ USD, vượt xa ước tính của các nhà phân tích Bernstein là 11,35 tỉ USD.
Theo các nhà phân tích từ hãng Wedbush Securities, những kết quả này của Nvidia tuy ấn tượng nhưng lại có ý nghĩa lớn hơn với “cơn sốt vàng AI”.
Wedbush Securities gọi ngành AI là "thời điểm 1995 chứ không phải 1999/2000", ám chỉ năm mà sự quan tâm đến internet bùng nổ và những năm mà bong bóng dot-com bùng nổ vào cuối thế kỷ 20.
Wedbush Securities lập luận rằng kết quả kinh doanh của Nvidia là dấu hiệu cho thấy chi tiêu cho AI sẽ tiếp tục tăng và tránh sự sụp đổ kiểu dot-com.
Theo ước tính từ Công ty Dữ liệu Quốc tế (IDC), chi tiêu cho AI sẽ tăng trung bình 27% mỗi năm trong khoảng thời gian từ 2022 đến 2026.
Các nhà phân tích của Wedbush Securities cho biết trong một tuyên bố: “Sự phát triển này không giống bất cứ điều gì chúng ta từng thấy kể từ internet vào năm 1995”.
Theo báo cáo của Mark Doms, nhà kinh tế cấp cao tại Ngân hàng Dự trữ Liên bang ở thành phố San Francisco (Mỹ), lĩnh vực CNTT tăng trưởng trung bình 24% mỗi năm từ 1995 đến 2000, nhưng giảm mạnh vào năm 2001 và 2002.
H100 luôn trong tình trạng cháy hàng dù giá cao
Có kích thước bằng một phong thư, H100 luôn trong tình trạng cháy hàng dù giá lên tới 40.000 USD.
Nvidia H100 là GPU mạnh nhất hiện có trên thị trường, đồng thời cũng có mức giá đắt đỏ nhất. Thông số kỹ thuật cho thấy Nvidia H100 mạnh gấp ba lần bản tiền nhiệm A100, nhưng chi phí vận hành chỉ bằng 1,5 - 2 lần. Jensen Huang mô tả đây là "hệ thống đầu tiên trên thế giới được thiết kế cho siêu AI".
Trong việc huấn luyện AI, GPU chiếm ưu thế so với CPU nhờ khả năng tiến hành song song hàng loạt tính toán. Emad Mostaque, Giám đốc điều hành Stability AI, đánh giá H100 đã giải quyết bài toán đẩy nhanh quá trình đào tạo mô hình ngôn ngữ lớn, giúp giảm bớt khó khăn cho các công ty trong lĩnh vực trí tuệ nhân tạo. Sự bùng nổ bất ngờ của AI đã đưa Nvidia vào nhóm doanh nghiệp ngàn tỉ USD, nhưng cũng khiến H100 trở nên khan hiếm.
"Đó là một trong những nguồn tài nguyên kỹ thuật số hiếm nhất hành tinh", Brannin McBee, nhà sáng lập công ty cơ sở hạ tầng đám mây CoreWeave, nhận định. Theo Telegraph, "ngay cả khi có tiền, bạn phải là người may mắn mới có thể sở hữu một chiếc H100".
Nhiều quốc gia và các ông lớn trong ngành công nghệ đang muốn thu thập H100 nhiều nhất có thể. Với sự nở rộ của generative AI, GPU hiệu năng cao như H100 trở thành công cụ để xây dựng mô hình mô hình ngôn ngữ lớn. Hiện chỉ có Nvidia đủ khả năng sản xuất GPU mạnh như H100, do đó họ toàn quyền quyết định sản lượng trên thị trường.
Generative AI là một loại trí tuệ nhân tạo được lập trình để tự động tạo ra nội dung mới, như văn bản, hình ảnh, âm thanh và video. Nó khác với các hệ thống AI khác như máy học sâu (deep learning) hoặc học máy (machine learning) trong việc dự đoán kết quả từ dữ liệu đã có sẵn. Thay vì dựa trên dữ liệu huấn luyện, hệ thống generative AI có khả năng tự tạo ra dữ liệu mới và phong phú hơn.
Thống kê cho thấy các đơn vị chuyên về AI đang dẫn đầu về nhu cầu GPU. Elon Musk dự đoán OpenAI, nhà phát triển ChatGPT, sẽ mua 30.000 - 50.000 chip để vận hành GPT-5.
Vào tháng 2, nhóm phân tích Morgan Stanley cũng cho rằng GPT-5 cần đến 25.000 mẫu H100. OpenAI không đưa ra con số cụ thể, nhưng Giám đốc điều hành Sam Altman khẳng định công ty vẫn thiếu chip đồ họa dù đã có hàng chục nghìn A100 cho GPT-4.
Inflection AI, dự án khởi nghiệp được rót vốn bởi Microsoft và Nvidia, nói đã mua 22.000 chiếc H100 để xây dựng trung tâm AI của riêng mình. Trong khi Meta Platforms muốn hơn 100.000 chiếc H100 trong tương lai.
Nhóm công ty điện toán đám mây cũng thuộc danh sách sở hữu nhiều chip thế hệ mới, trung bình mỗi đơn vị mua 30.000 GPU của Nvidia. Trong đó, Google Cloud Platform mua 26.000 chiếc H100, Microsoft Azure mua 10.000 - 40.000 H100, Amazon Web Service đặt hàng 20.000 H100 và CoreWeave muốn có 35.000 - 40.000 chiếc H100.
Các doanh nghiệp công nghệ hoặc tổ chức nhỏ thường đặt hàng dưới 10.000 GPU. Chẳng hạn, Đại học Kaust tại Ả Rập Saudi vừa mua 3.000 H100 với giá trị tổng cộng 120 triệu USD, hạn giao hàng cuối 2023.
Một số chuyên gia ước tính doanh số H100 trên toàn cầu đạt hơn 430.000 chiếc trong năm nay, trị giá tương đương 15 tỉ USD. Thống kê này chưa bao gồm sở hữu từ ByteDance, Baidu hay Tencent, những công ty lớn tại Trung Quốc bị ảnh hưởng từ luật cấm xuất khẩu chip của Tổng thống Mỹ - Joe Biden. Trong khi đó, Financial Times cho rằng lượng H100 mà Nvidia thực tế sản xuất năm nay đạt 550.000 chiếc và đã được đặt mua hết.
Vào tháng 5, Elon Musk nói việc tìm mua GPU thậm chí "khó hơn so với chất gây nghiện". Một số khách hàng phải đợi sáu tháng để nhận H100.
Ian Buck, người đứng đầu bộ phận kinh doanh Nvidia, cho biết nhiệm vụ khó khăn nhất của công ty là tăng nguồn cung H100 nhằm đáp ứng khách hàng. "Nhu cầu thị trường rất lớn. Nhiều đơn vị đang đặt mua hàng chục ngàn GPU", ông nói.
Cập nhật tin tức công nghệ mới nhất tại fanpage Công nghệ & Cuộc sống