Radeon ओपन कंप्यूट 'ROCm' स्टैक v3.1 वेगा 7nm के लिए RAS के साथ जारी, बेहतर संसाधन प्रबंधन के लिए SLURM समर्थन, लेकिन नवी स्टिल मिसिंग

हार्डवेयर / Radeon ओपन कंप्यूट 'ROCm' स्टैक v3.1 वेगा 7nm के लिए RAS के साथ जारी, बेहतर संसाधन प्रबंधन के लिए SLURM समर्थन, लेकिन नवी स्टिल मिसिंग 2 मिनट पढ़ा

AMD Radeon



Radeon Open Compute या 'ROCm' स्टैक नया संस्करण अब है उपलब्ध डाउनलोड के लिए। Radeon Open Compute v3.1 अपने साथ कुछ खूबियां लेकर आया है, लेकिन अजीब बात है कि AMD नवी के साथ-साथ GFX10 के लिए सपोर्ट अभी भी गायब है।

ROCm, GPU- त्वरित कंप्यूटिंग के लिए सबसे व्यापक रूप से स्वीकृत सार्वभौमिक प्लेटफ़ॉर्म, अब संस्करण 3.1 पर है। मॉड्यूलर प्लेटफॉर्म के लिए नवीनतम अपडेट जो हार्डवेयर विक्रेताओं को आरओसीएम फ्रेमवर्क का समर्थन करने वाले ड्राइवरों का निर्माण करने की अनुमति देता है, इसमें कुछ बहुप्रतीक्षित विशेषताएं शामिल हैं जैसे कि आरएमए समर्थन के लिए 7nm वेगा और AMD GPU के लिए SLURM समर्थन। हालाँकि, अभी तक अज्ञात कारणों के लिए, ROCm को अभी भी अगली पीढ़ी के AMD नवी आर्किटेक्चर के लिए पूरा समर्थन नहीं मिला है।



Radeon ROCm v3.1 में नया क्या है:

Radeon ROCm v3.1 की नई स्थापना में सबसे बड़ा और सबसे स्पष्ट परिवर्तन ROCm अधिष्ठापन निर्देशिका संरचना में है। आरओसीएम टूलकिट की एक ताजा स्थापना संकुल को अंदर स्थापित करती है / Opt / rocm- फ़ोल्डर। पहले, ROCm टूलकिट पैकेज में स्थापित किए गए थे / Opt / rocm फ़ोल्डर।



आरओसीएम के नए संस्करण ने वेगा 7 एनएम जीपीयू के लिए विश्वसनीयता, पहुंच और सेवा क्षमता (आरएएस) समर्थन बढ़ाया है। यह 7nm वेगा काम संभवतः माइक्रोस्कोप के तहत अभी भी है वेगा आधारित 'आर्कटुरस' गणना त्वरक इस साल आ रहा है। समर्थन में शामिल हैं:



  • UMC RAS ​​- HBM ECC (अचूक त्रुटि इंजेक्शन), पेज रिटायरमेंट, GPU के माध्यम से RAS रिकवरी (BACO) रीसेट
  • GFX RAS - GFX, MMHUB ECC (अचूक त्रुटि इंजेक्शन), GPU (BOO) रीसेट के माध्यम से RAS रिकवरी
  • PCIE RAS - PCIE_BIF ECC (अचूक त्रुटि इंजेक्शन), GPU (BACO) रीसेट के माध्यम से RAS रिकवरी

Radeon ROCm v3.1 को AMD GPU के लिए SLURM सपोर्ट भी मिलता है। संसाधन प्रबंधन के लिए SLURM या सरल लिनक्स उपयोगिता लिनक्स क्लस्टर के लिए अत्यधिक पसंदीदा और आसानी से उपयोग किए जाने वाले क्लस्टर प्रबंधन और नौकरी निर्धारण प्रणाली में से एक है। SLURM को ओपन-सोर्स, फॉल्ट-टॉलरेंट और अत्यधिक स्केलेबल होने के कारण पसंद किया जाता है।

यह सिस्टम अब AMD GPU के साथ अच्छी तरह से इंटरैक्ट कर सकता है। SLURM के नवीनतम संस्करण 20.02.0 में AMD प्लगइन्स शामिल हैं जो SLMM को स्वचालित रूप से AMD GPU का पता लगाने और कॉन्फ़िगर करने में सक्षम बनाता है। यह ग्राफिक्स चिप्स की ऊर्जा खपत को इकट्ठा और रिपोर्ट भी करता है। SLURM समर्थन एक उपयोगी जोड़ है जो राड्यूजन जीपीयू और अन्य बड़े एएमडी जीपीयू क्लस्टर का उपयोग करके सुपर-कंप्यूटिंग तैनाती की बढ़ती संख्या को देखते हुए है।

कई विशेषताओं को शामिल किए जाने के बावजूद, ROCm में अभी भी GFX10 / नवी समर्थन के कोई संकेत नहीं हैं। ROCm के लिए GitHub पेज सभी परिवर्तनों, स्थापना नोट्स और ज्ञात समस्याओं को प्रतिबिंबित करने के लिए अद्यतन किया गया है।



टैग एएमडी