Meta ra mắt phiên bản chip AI tự phát triển mới: hiệu năng cải thiện gấp 3 lần so với thế hệ trước, giảm phụ thuộc vào NVIDIA

SkylerNew

Chuyên viên tin tức
Thành viên BQT
Khi chip AI (trí tuệ nhân tạo) khan hiếm, ngày càng có nhiều gã khổng lồ công nghệ lựa chọn phát triển chip của riêng mình.

Vào ngày 10 tháng 4, giờ địa phương, gã khổng lồ xã hội Meta đã công bố phiên bản mới nhất của chip MTIA được phát triển độc lập. MTIA là dòng chip tùy chỉnh của Meta được thiết kế dành riêng cho công việc suy luận và đào tạo AI. So với bộ tăng tốc suy luận AI thế hệ đầu tiên MTIA v1 của Meta, được công bố chính thức vào tháng 5 năm ngoái, phiên bản chip mới nhất đã cải thiện đáng kể hiệu suất và được thiết kế đặc biệt cho hệ thống xếp hạng và đề xuất của phần mềm xã hội Meta. Phân tích chỉ ra rằng mục tiêu của Meta là giảm sự phụ thuộc vào các nhà sản xuất chip như Nvidia.

786432_141218525158233_2338665527246848

Vào ngày 10, giá cổ phiếu Meta (Nasdaq: META) đóng cửa ở mức 519,83 USD/cổ phiếu, tăng 0,57%, với tổng giá trị thị trường là 1,33 nghìn tỷ USD. Dữ liệu gió cho thấy giá cổ phiếu của Meta đã tăng hơn 47% kể từ đầu năm nay.

Đánh giá từ cái tên, MTIA là tên viết tắt của "Meta Training and Inference Accelerator". Dù có từ "đào tạo", con chip này thực chất không được tối ưu hóa cho việc đào tạo AI mà tập trung vào suy luận, nhiệm vụ chạy các mô hình AI trong quá trình sản xuất.

Meta đã viết trong một bài đăng trên blog rằng MTIA là “một phần quan trọng trong kế hoạch dài hạn của công ty” nhằm sử dụng AI trong các dịch vụ của Meta nhằm xây dựng cơ sở hạ tầng: “Để hiện thực hóa tham vọng của chúng tôi về chip tùy chỉnh, điều này có nghĩa là đầu tư không chỉ vào chip Máy tính mà còn cũng đầu tư vào băng thông bộ nhớ, mạng và dung lượng cũng như các hệ thống phần cứng thế hệ tiếp theo khác".

Theo báo cáo, chip MTIA mới "về cơ bản tập trung vào việc cung cấp sự cân bằng hợp lý giữa tính toán, băng thông bộ nhớ và dung lượng bộ nhớ". Chip MTIA v1 ban đầu sử dụng công nghệ xử lý 7nm của TSMC, trong khi chip MTIA mới sử dụng quy trình 5nm của TSMC và có nhiều lõi xử lý hơn. Con chip này sẽ có bộ nhớ trên chip 256 MB tốc độ 1,3 GHz, so với 128 MB và 800 GHz của MTIA v1. Kết quả thử nghiệm ban đầu của Meta cho thấy chip mới mạnh hơn gấp ba lần so với phiên bản thế hệ đầu tiên bằng cách kiểm tra hiệu năng của "bốn model chủ chốt" của hai chip.

Về mặt phần cứng, để hỗ trợ các chip thế hệ tiếp theo, Meta đã phát triển một hệ thống gắn trên giá lớn có thể chứa tới 72 máy gia tốc. Nó bao gồm ba khung, mỗi khung chứa 12 bảng, mỗi bảng chứa hai máy gia tốc. Hệ thống có thể tăng tần số xung nhịp của chip từ 800 MHz ban đầu lên 1,35GHz và chạy ở công suất 90 watt, so với 25 watt của thiết kế ban đầu.

Meta ra mắt phiên bản chip AI tự phát triển mới: hiệu năng cải thiện gấp 3 lần so với thế hệ trước, giảm phụ thuộc vào NVIDIA


Về phần mềm, Meta nhấn mạnh, stack phần mềm chạy trên hệ thống chip mới rất giống với MTIA v1, giúp đẩy nhanh tốc độ triển khai của nhóm. Ngoài ra, MTIA mới tương thích với mã được phát triển cho MTIA v1 và vì Meta đã tích hợp ngăn xếp phần mềm hoàn chỉnh vào chip nên các nhà phát triển có thể thiết lập và chạy lưu lượng truy cập của Meta trong vòng vài ngày bằng cách sử dụng chip mới này, cho phép Meta thực hiện trong vòng chín tháng, con chip đã được triển khai ở 16 khu vực và mô hình sản xuất đang chạy.

Theo tóm tắt của Meta, kết quả thử nghiệm cho đến nay cho thấy chip MTIA này có thể xử lý độ phức tạp thấp (LC) và độ phức tạp cao (HC) là các thành phần trong bảng xếp hạng sản phẩm của Meta và các mô hình được đề xuất: "Vì chúng tôi kiểm soát toàn bộ ngăn xếp nên nó tương thích. với thương mại, chúng tôi có thể đạt được hiệu suất cao hơn nhiều so với GPU."

Hiện tại, chip MTIA mới đã được triển khai trong các trung tâm dữ liệu của Meta và đang cho thấy kết quả tích cực: "Công ty có thể dành và đầu tư nhiều sức mạnh tính toán hơn cho khối lượng công việc AI chuyên sâu hơn. Nó đã được chứng minh là có hiệu quả trong việc cung cấp khối lượng công việc dành riêng cho meta. "Con chip này bổ sung rất nhiều cho GPU thương mại về sự kết hợp tốt nhất giữa hiệu suất và hiệu quả".

Vào tháng 2 năm nay, truyền thông nước ngoài đã tiết lộ tin tức về chip MTIA thế hệ thứ hai, cho biết Meta dự định đưa vào sản xuất trong năm nay một con chip AI có tên nội bộ là "Artemis" để đẩy nhanh hơn nữa sự phát triển của công ty trong lĩnh vực AI. Vào thời điểm đó, người phát ngôn của Meta đã xác nhận kế hoạch này là đúng và nói rằng con chip này sẽ hoạt động với hàng trăm nghìn GPU mà Meta đã mua.

Khi cuộc cạnh tranh AI ngày càng gay gắt, các chip AI hiệu suất cao ngày càng trở nên phổ biến. Vào ngày 18 tháng 1 năm nay, Giám đốc điều hành Meta, Mark Zuckerberg, đã thông báo một cách đầy ấn tượng rằng Meta đang có kế hoạch xây dựng AGI (trí tuệ nhân tạo) của riêng mình và dự kiến sẽ nhận được khoảng 350.000 GPU H100 từ Nvidia vào cuối năm nay. GPU, tổng sức mạnh tính toán của công ty sẽ gần bằng sức mạnh tính toán mà 600.000 H100 có thể cung cấp. Ngay cả khi dựa trên giá bán tối thiểu của star chip H100 là 25.000 USD, Meta vẫn sẽ trả khoảng 8,75 tỷ USD cho 350.000 H100.

Tất nhiên, Meta không phải là gã khổng lồ công nghệ duy nhất chuyển sự chú ý sang chip tự phát triển. Chỉ vài ngày trước, Google đã thông báo rằng họ đang sản xuất một CPU tùy chỉnh dựa trên kiến trúc ARM, được gọi là "Axion", dự kiến hỗ trợ các dịch vụ như quảng cáo YouTube trên Google Cloud và sẽ ra mắt vào cuối năm 2024. Trước đó, cả Microsoft và Amazon cũng bắt đầu phát triển các chip tùy chỉnh có thể xử lý các tác vụ AI.

Các nhà phân tích từ công ty nghiên cứu thị trường CFRA cho rằng, các công ty công nghệ lớn này đang phải đối mặt với áp lực chi phí và cần phải dựa vào chip tự phát triển để giảm bớt áp lực. Mặc dù những con chip này “cần thiết” đối với hãng nhưng có thể chúng không thể sánh được với hiệu năng của các sản phẩm nền tảng Blackwell mới nhất của Nvidia.

Theo VN review
 
Bên trên