Bộ nhớ GDDR5X khác gì với GDDR5 và hiệu năng được cải thiện như thế nào?

Bộ nhớ GDDR5X khác gì với GDDR5 và hiệu năng được cải thiện như thế nào?

Như vậy Nvidia đã là nhà sản xuất đầu tiên ra mắt card đồ họa dùng bộ nhớ GDDR5X với phiên bản GeForce GTX 1080. Mẫu card này dùng lõi đồ họa kiến trúc Pascal GP104, sản xuất trển quy trình FinFET 16 nm của TSMC và có 8 GB bộ nhớ GDDR5X. Bên cạnh kiến trúc Pascal thì bộ nhớ GDDR5X là một thành phần rất quan trọng ảnh hưởng đến hiệu năng đồ họa. Vậy GDDR5X khác gì so với GDDR5 và hiệu năng sẽ được cải tiến ra sao?

Chuẩn GDDR5X SGRAM (Synchronous Graphics Random Access Memory) được phát triển dựa trên công nghệ GDDR5 có từ năm 2007. GDDR5X được thiết kế nhằm mục tiêu tăng băng thông cho các vi xử lý đồ họa hiệu năng cao mà không cần thay đổi kiến trúc bộ nhớ của GPU hay bản thân công nghệ bộ nhớ, tương tự như các thế hệ GDDR trước đây. GDDR5X mang lại 3 cải tiến cốt lõi cho GDDR5 gồm: tăng tốc độ truyền tải dữ liệu lên tối đa là gấp đôi, tiết kiệm điện năng hơn và mở ra nhiều kiểu thiết lập bộ nhớ với mật độ cao hơn trên các vi xử lý đồ họa hoặc thiết bị. Điều tối quan trọng đối với các nhà phát triển chip và nhà sản xuất card đồ họa là GDDR5X không đòi hỏi phải thay đổi nhiều về thiết kế của card và các tính năng thông thường của GDDR5 vẫn được giữ nguyên.

Những cải tiến về hiệu năng:

Hiện tại những chip nhớ GDDR5 có thể hoạt động với tốc độ truyền tải từ 7 đến 8 Gbps trên mỗi chân pin và tốc độ này có thể được cải thiện nếu thay đổi lệnh, địa chỉ và dữ liệu (những chỉ số tương ứng Command Clock (CK) và Write Clock (WCK)). Tuy nhiên, Micron Technology - một trong những nhà thiết kế chính của chuẩn GDDR5X và cũng là nhà cung cấp chip nhớ GDDR5X cho dòng card mới của Nvidia cho rằng giới hạn của chip nhớ GDDR5 đến từ tốc độ truy xuất hàng loạt và giao thức lệnh/địa chỉ và để cải thiện hiệu năng của loại bộ nhớ này, các kỹ sư phải thay đổi kiến trúc của chip nhớ.

Cải tiến quan trọng của chuẩn GDD5X so với các thế hệ trước là kiến trúc nạp trước 16n-prefetch hoàn toàn mới cho phép truyền tải đến 512 bit (64 bytes) thông tin trên mỗi chu kỳ truy xuất đọc hoặc ghi. Ngược lại, công nghệ GDDR5 hiện tại dùng kiến trúc 8n-prefetch và lượng thông tin trên mỗi chu kỳ giới hạn ở 256 bit (32 bytes).

Trước khi tìm hiểu sâu hơn, chúng ta hãy cùng xem lại bộ nhớ GDDR5:

GDDR5 hoạt động với 3 xung nhịp vi phân độc lập, phát động từ vi điều khiển bộ nhớ. Bộ nhớ GDDR5 cũng hoạt động theo cơ chế phân nhóm tín hiệu theo chân pin của DRAM thông thường bao gồm các nhóm chân pin: nhóm lệnh/điều khiển (command/control), nhóm địa chỉ (address pin) và nhóm dữ liệu (data pin). Một chip GDDR5 hiện tại có 67 chân pin tín hiệu/170 chân pin theo kiểu đóng gói BGA 170.

Xung_GDDR5.png

3 xung nhịp này bao gồm xung nhịp lệnh (CK) tương ứng với tín hiệu đầu vào (Input) của lệnh (command) và địa chỉ (address) và xung nhịp ghi (WCK) chia làm 2 xung phụ gồm xung vi phân WCK01 và WCK23 đảm nhận tín hiệu tương ứng với hoạt động đọc/ghi, truyền tải vào/ra các chân pin I/O. Các tín hiệu WCK chạy ở tần số tương đương với tốc độ truyền tải dữ liệu (data rate) của thiết bị ở chế độ DDR và mỗi xung truyền tải 16 bit (2 bytes) dữ liệu. Tần số của xung CK bằng 1 nửa tần số WCK.

Thử lấy ví dụ một bộ nhớ GDDR5 có tốc độ truyền tải 5 Gbps trên mỗi chân pin, xung CK chạy ở tần số 1,25 GHz thì xung WCK chạy ở xung 2,5 GHz. 2 xung này sẽ thẳng hàng với nhau, nhờ đó mang lại tốc độ truy xuất đọc/ghi với độ trễ tối thiểu.

Để đạt tốc độ truy xuất cao, GDDR5 sử dụng kiến trúc nạp trước 8n-prefetch. Với kiến trúc này, độ rộng bus dữ liệu đến và đi từ lõi bộ nhớ sẽ gấp 8 lần giao diện bộ đệm I/O. Giao diện GDDR5 sẽ truyền tải 2 chuỗi dữ liệu độ rộng 32 bit trên mỗi chu kỳ tần số xung nhịp ghi (WCK) đến/đi từ các chân pin I/O. Tương ứng với kiến trúc 8n-prefetch, mỗi lần truy xuất đọc hoặc ghi sẽ bao gồm một chuỗi dữ liệu rộng 256 bit với 2 chu kỳ tần số CK tại lõi bộ nhớ và 8 chuỗi dữ liệu rộng 32 bit tương ứng với 1,5 chu kỳ tần số WCK tại các chân pin I/O.

Xung.png

GDDR5X cũng hoạt động với các tần số tương tự là CK và WCK. Với kiến trúc 16n-prefetch tức độ rộng bus từ lõi bộ nhớ gấp 16 lần giao diện I/O, dữ liệu có thể truyền đi ở tốc độ truyền gấp đôi (DDR) hoặc gấp 4 lần (QDR) tương ứng với xung WCK dựa trên kiến trúc nạp trước nào (8n hay 16n) và giao thức nào được dùng. Theo đó, nếu nhà sản xuất chip tăng xung CK lên 1,5 GHz, xung WCK sẽ là 3 GHz thì tốc độ truyền tải theo thiết lập QDR/16n-prefetch sẽ tăng đến 12 Gbps/chân pin.

Chế_độ.png

GDDR5 sử dụng hệ thống bus dữ liệu dạng P2P, nạp đơn để tối ưu hóa hiệu năng. Các chip GDDR5 luôn được hàn xuống bo mạch PCB thay vì lắp trên thanh DIMM. Mỗi chip nhớ hỗ trợ 2 chế độ normal x32 hoặc clamshell x16. Ở chế độ x16, bus dữ liệu được chia thành 2 bus rộng 16-bit định hướng độc lập đến mỗi chip nhớ. Các chân pin đảm nhận địa chỉ và lệnh sẽ được chia sẻ dữ liệu giữa 2 chip nhớ trong khi vẫn giữ nguyên số lượng chân pin I/O tại vi điều khiển bộ nhớ.

GDDR5 hỗ trợ giao thức chuỗi chuẩn bị và cân chỉnh thời gian (interface training sequence) nhằm đảm bảo chip nhớ hoạt động với biên độ thời gian rộng nhất đối với mọi tín hiệu truy xuất. Quá trình chuẩn bị và cân chỉnh được thực hiện bởi vi điều khiển bộ nhớ bao gồm các bước khởi động (power-up), cân chỉnh địa chỉ, cân chỉnh xung nhịp WCK-CK, cân chỉnh xung nhịp đọc và ghi. Do GDDR5X sử dụng giao thức và chuỗi chuẩn bị/cân chỉnh tín hiệu tương tự GDDR5 nên các nhà phát triển chip có thể điều chỉnh vi điều khiển tương ứng với bộ nhớ mới.

So_sánh_công_nghệ_DRAM.png

Mặc dù theo ước lượng của Hiệp hội JEDEC, GDDR5X sẽ có tốc độ truyền tải dữ liệu từ 10 đến 14 Gbps/pin nhưng Micron tin rằng tốc độ này có thể đạt đến 16 Gbps. Nếu chip GDDR5X được thiết lập 256-bit, chạy ở tốc độ 14 Gbps thì tổng băng thông bộ nhớ có thể lên đến 448 GB/s, chỉ thấp hơn 12,5% so với băng thông của bộ nhớ HBM hiện đang được dùng trên card đồ họa AMD Fury X.

Cải tiến về dung lượng:

Không chỉ hiệu năng, các nhà phát triển cũng muốn tăng dung lượng của bộ nhớ GDDR5X để có thể xuất hiện trên nhiều thiết bị hơn không chỉ card đồ họa như máy chơi game console, thiết bị mạng, …

Trở lại với GDDR5, các chip nhớ thường được thiết lập theo dung lượng 512 Mb, 1 Gb, 2 Gb, 4 Gb và 8 Gb. Cần lưu ý chip nhớ (memory chip) là thành phần thấp nhất của bộ nhớ, chúng là các IC tạo nên mỗi mô-đun nhớ (memory module) và đơn vị đo mật độ của chip nhớ là bit. Một mô-đun nhớ sẽ có nhiều chip nhớ.

Trong khi đó, GDDR5X đưa ra các thiết lập gồm 4 Gb, 6 Gb, 8 Gb, 12 GB và 16 Gb. Thông thường, ngành công nghiệp DRAM có xu hướng tăng gấp đôi dung lượng của chip nhớ vì yếu tố kinh tế và các vấn đề kỹ thuật. Tuy nhiên, với GDDR5X thì các nhà sản xuất quyết định thông qua các thiết lập SGRAM với các mức dung lượng "lạ" là 6 Gb và 12 Gb.

Trên thiết bị di động dùng RAM LPDDR, các mức dung lượng chip nhớ như 3 Gb, 6 Gb hay 12 Gb thường được dùng để đạt độ linh hoạt về thiết lập bộ nhớ tối đa. Và các nhà sản xuất bộ nhớ đồ họa cũng muốn khai thác sự linh hoạt này. Một chip GDDR5X với dung lượng 16 Gb sản xuất trên quy trình 20 nm hoặc 16/18 nm sẽ có kích thước đế chip (die size) lớn hơn, do đó chi phí sản xuất sẽ cao hơn. Tuy nhiên, kích thước và chi phí của một chip nhớ DRAM 12 Gb được cho là rẻ hơn và mức dung lượng này có thể phục vụ cho nhiều ứng dụng trong nhiều phân khúc thị trường hơn.

Chế_độ_GDDR5X.png

Cũng như GDDR5, chuẩn GDDR5X cũng hỗ trợ hoàn toàn chế độ clamshell (x16) bên cạnh chế độ normal (x32). Ở chế độ x16 thì bus dữ liệu được chia thành 2 bus với độ rộng 16-bit và được định hướng độc lập đến mỗi chip nhớ. Đây là một phương pháp thiết lập nhằm tăng gấp đôi mật độ bộ nhớ trong kênh, cũng giống như việc chúng ta gắn thêm các thành RAM DIMM vào máy tính để chạy kênh đôi. Ở chế độ x32 thì tất cả các pin truy xuất dữ liệu tốc độ cao và chân pin WCK sẽ được định hướng điểm đến điểm (P2P). Trong khi đó ở chế độ x16 thì tất cả các pin truy xuất tốc độ cao và WCK được định hướng đến 2 chip nhớ hay điểm đến 2 điểm (P22P) trong khi vẫn giữ nguyên số lượng chân pin truy xuất I/O tại vi điều khiển bộ nhớ là 16 pin. Cách thiết lập này không ảnh hưởng đến băng thông hệ thống nhưng cho phép tăng gấp đôi số lượng thành phần bộ nhớ trên mỗi kênh. Như vậy về mặt lý thuyết, các nhà sản xuất có thể tạo ra một chiếc card đồ họa với bộ nhớ 64 GB GDDR5X bằng việc sử dụng một GPU hỗ trợ bus nhớ 512-bit và 32 chip nhớ GDDR5X dung lượng 16 Gb.

Dung lượng không bình thường của chip nhớ GDDR5X sẽ đáp ứng nhu cầu của nhiều phân khúc thị trường bao gồm card đồ họa, HPC, máy chơi game console, … Tuy nhiên, cũng cần lưu ý là đối thủ hàng đầu của GDDR5X là HBM2 có thể mang lại nhiều lợi thế, đặc biệt là ở phân khúc card đồ họa cao cấp với những chiếc máy tính đòi hỏi hiệu năng xử lý cao (HPC).

Cải tiến về mức tiêu thụ điện năng:

Điện năng tiêu thụ và tản nhiệt là yếu tố chính tác động đến hiệu năng tính toán. Khi phát triển chuẩn GDDR5X thì các nhà sản xuất cũng đã tích hợp nhiều giải pháp để giảm mức tiêu thụ điện. Điện áp nguồn (Vdd) và điện áp I/O (Vddq) đã được giảm từ 1,5 V (trên các thiết bị dùng chip nhớ GDDR5 cao cấp) xuống còn 1,35 V. Việc cắt giảm điện áp Vdd và Vddq giúp giảm mức tiêu thụ điện tổng thể của chip nhớ mới đến 10%, một rất quan trọng đối với các thiết bị hiệu năng cao và thiết bị di động.

Điện_năng.png

Bên cạnh đó, GDDR5X còn tích hợp tính năng điều khiển cảm biến nhiệt độ theo tốc độ làm tươi - một công nghệ giúp tối ưu hóa mức tiêu thụ điện năng trong một số tình huống sử dụng nhất định. Nhiều tính năng khác về xung nhịp, về tỉ lệ làm tươi ở các trạng thái hoạt động cũng được tối ưu hóa nhằm thu hẹp mức tiêu thụ điện năng.

Nhờ điện áp thấp vào nhiều tính năng cải tiến, mức tiêu thụ điện sẽ thấp hơn so với những chip nhớ GDDR5 với cùng xung nhịp. Tuy nhiên, nếu nói về tốc độ truyền tải dữ liệu của GDDR5X thì mức tiêu thụ điện năng của thế hệ chip này có thể tương được hoặc cao hơn đôi chút so với GDDR5 theo Micron. Công ty cho biết mức tiêu thụ điện năng của GDDR5X vào khoảng 2 đế 2,5 W/thành phần DRAM và từ 10 đến 30 W/toàn bo mạch. Mặc dù có mức tiêu thụ điện năng ngang bằng và thậm chí là cao hơn nhưng GDDR5X vẫn được xem là tiết kiệm điện năng hơn dựa trên hiệu năng mà nó mang lại so với GDDR5. Nếu AMD hay Nvidia có thể tạo ra những card đồ họa mới dùng bộ nhớ GDDR5X và đạt được tốc độ truyền tải dữ liệu đến 14 Gb/s thì họ có thể tăng gấp đôi băng thông bộ nhớ của các vi xử lý đồ họa so với GDDR5 mà không làm tăng điện năng tiêu thụ.

Ứng dụng:

Sự chuyển dịch từ GDDR5X sang GDDR5 không phải là một sự thay đổi hoàn toàn giống như từ GDDR5 sang HBM. Mặc dù vậy, để chuyển từ GDDR5 sang GDDR5X thì các nhà sản xuất cùng phải mất khá nhiều thời gian, giống như lần chuyển dịch từ GDDR3/GDDR4 sang GDDR5 nhiều năm trước.

2016-05-07_18-36-06.png

Vấn đề nằm ở chỗ GDDR5X sử dụng kĩ thuật đóng gói BGA-190 với 190 chân pin trong khi GDDR5 dùng kĩ thuật BGA-170. Do đó, GDDR5X không tương thích về số lượng chân pin với các chip nhớ GDDR5 cũng như các bo mạch dùng chip nhớ GDDR5 hiện tại. Mặc dù GDDR5X sẽ đòi hỏi bo mạch mới và vi điều khiển mới nhưng cách phát triển không khác gì với GDDR5; các tính năng chuẩn bị chuỗi tín hiệu, xử lý tín hiệu, soát lỗi, giao thức đều như nhau và thậm chí là các chế độ thiết lập normal hay clamshell tốc độ cao cũng được GDDR5X hỗ trợ không khác gì GDDR5. Ngoài ra, kiểu đóng gói BGA cũng không đắt bởi nó không cần đến các đoạn bán dẫn định hướng giữa các chân tiếp xúc và cũng không sử dụng kĩ thuật xếp lớp chân chip như HBM. Do đó, GDDR5X sẽ không quá đắt nếu xét về khía cạnh nghiên cứu và phát triển cũng như sản xuất.

Theo: Micron; Wikipedia [1], [2], AnandTech, và nhiều nguồn khác
 

Cập nhật tin tức công nghệ mới nhất tại fanpage Công nghệ & Cuộc sống

Nguồn tin:

 
 

Tham gia bình luận