विंडोजवर CUDA स्थापित करण्यासाठी ट्यूटोरियल

  • सुसंगतता: समर्थित विंडोज आवृत्त्या, योग्य ड्रायव्हर्स आणि योग्यरित्या कॉन्फिगर केलेले WDDM/TCC मॉडेल.
  • लवचिक स्थापना: ग्राफिकल किंवा सायलेंट टूलकिट, कोंडा आणि व्हील्स, नमुन्यांद्वारे पडताळणीसह.
  • हायब्रिड वातावरण: विंडोजवरील लिनक्समध्ये किमान कर्नल, डॉकर आणि एआय फ्रेमवर्कसह WSL सपोर्ट.

विंडोजवरील CUDA

विंडोजवर CUDA स्थापित करणे अधिकृत मार्गदर्शकांनी प्रमाणित केलेल्या स्पष्ट मार्गाचे अनुसरण केल्यास डोकेदुखी होण्याची गरज नाही. या व्यावहारिक आणि तांत्रिक मार्गदर्शकामध्ये, आम्ही मूळ विंडोज आणि WSL दोन्हीमध्ये टूलकिट, ड्रायव्हर्स आणि पडताळणी साधने सुधारण्यासाठी आवश्यक असलेल्या सर्व गोष्टींचा समावेश करू. तुमचे काम करणारे आणि चाचणी केलेले इंस्टॉलेशन मिळावे हे ध्येय आहे., तुमच्या GPU वर्कफ्लोला गती देण्यासाठी सज्ज.

क्लासिक पायऱ्यांव्यतिरिक्त, आम्ही व्हिज्युअल स्टुडिओ सुसंगतता, सायलेंट इंस्टॉलेशन, कॉन्डा पॅकेजेस आणि एनव्हीआयडीए व्हील्स, CUDA उदाहरणांसह पडताळणी, WSL वैशिष्ट्ये आणि प्रमुख रिलीज नोट्स (जसे की CUDA 13 मधील इंस्टॉलरमधून ड्रायव्हर काढून टाकणे) समाविष्ट करू. सामान्य समस्यांचे निदान कसे करायचे ते देखील तुम्हाला दिसेल. (लेनोवो आयडियापॅड आणि ५२६.५६ ड्रायव्हर्ससह रिअल-वर्ल्ड केससह) आणि CUDA १०.१ आणि cuDNN ७.६.४ सह मॉडेल बिल्डर सारख्या विशिष्ट परिस्थितींसाठी विशिष्ट आवश्यकता.

CUDA म्हणजे काय?

CUDA हे NVIDIA चे समांतर प्रोग्रामिंग प्लॅटफॉर्म आणि मॉडेल आहे जे GPU वर संगणकीय-केंद्रित अनुप्रयोगांच्या प्रवेगला अनुमती देते. CUDA C/C++ आणि त्याच्या विस्तारांसह तुम्ही अल्गोरिथम समांतर करण्यावर लक्ष केंद्रित करू शकता, तर CUDA रनटाइम CPU आणि GPU मधील एक्झिक्युशन आणि मेमरी व्यवस्थापित करतो. सिरीयल (CPU) आणि पॅरलल (GPU) काम विभाजित करून, हजारो थ्रेड्सचा वापर करून कामगिरीचे प्रमाण वाढवणे शक्य आहे. आणि सामायिक ऑन-चिप मेमरी.

हे मार्गदर्शक विंडोज (नेटिव्ह आणि WSL) मधील वातावरण कसे सुधारायचे, टूलकिट कसे स्थापित करायचे, उदाहरणे कशी संकलित करायची आणि सिस्टम GPU योग्यरित्या शोधते याची पडताळणी कशी करायची यावर लक्ष केंद्रित करते. deviceQuery आणि bandwidthTest सारख्या नमुन्यांसह पडताळणी हा एक महत्त्वाचा मुद्दा आहे जो अनेकदा दुर्लक्षित केला जातो आणि ज्याचा आपण येथे स्पष्टपणे उल्लेख करतो.

CUDA

सिस्टम आवश्यकता आणि समर्थित विंडोज आवृत्त्या

CUDA वापरण्यासाठी तुम्हाला सुसंगत NVIDIA GPU आणि समर्थित Windows ऑपरेटिंग सिस्टमची आवश्यकता आहे. ऑपरेटिंग सिस्टमच्या समर्थित आवृत्त्यांमध्ये हे समाविष्ट आहे:विंडोज ११ २४एच२, २३एच२ आणि २२एच२-एसव्ही२; विंडोज १० २२एच२; विंडोज सर्व्हर २०२२ आणि विंडोज सर्व्हर २०२५. डिव्हाइस मॅनेजरमध्ये तपासा की तुमचे कार्ड डिस्प्ले अ‍ॅडॉप्टर अंतर्गत दिसते आणि CUDA-सक्षम GPU च्या अधिकृत यादीमध्ये (NVIDIA पृष्ठ) त्याची सुसंगतता सत्यापित करा.

कंपाइलर स्तरावर, टूलकिट व्हिज्युअल स्टुडिओ २०२२ १७.x (C++११/१४/१७/२०) मध्ये MSVC १९३x आणि व्हिज्युअल स्टुडिओ २०१९ १६.x (C++११/१४/१७) मध्ये MSVC १९२x ला सपोर्ट करते. व्हिज्युअल स्टुडिओ २०१५ साठी समर्थन ११.१ मध्ये बंद करण्यात आले.VS २०१७ साठी, ते आवृत्ती १२.५ मध्ये कालबाह्य झाले आणि १३.० मध्ये काढून टाकले गेले. लक्षात ठेवा की CUDA १२.० (नेटिव्ह आणि क्रॉस-कंपाइलेशन) पासून ३२-बिट संकलन काढून टाकण्यात आले; जर तुम्हाला ३२-बिटची आवश्यकता असेल, तर तुम्हाला जुने टूलकिट वापरावे लागतील.

जरी NVIDIA ड्रायव्हर Ada आर्किटेक्चरपर्यंत GeForce GPU वर 32-बिट बायनरी चालवण्याची परवानगी देत ​​राहील, त्या आधारासह अडा ही शेवटची असेल.हॉपर आता ३२-बिट अॅप्लिकेशन्सना सपोर्ट करत नाही. जर तुम्ही उत्पादनात लेगसी सॉफ्टवेअर राखत असाल आणि अपग्रेडसाठी योजना आखत असाल तर हे अत्यंत महत्त्वाचे आहे.

विंडोज १० आणि नंतरच्या आवृत्तीत, एनव्हीआयडीए ड्रायव्हर दोन मॉडेल्स अंतर्गत ऑपरेट करू शकतो: WDDM (डिस्प्ले उपकरणांसाठी) आणि टेस्ला किंवा काही टायटन मॉडेल्ससारख्या व्हिडिओ आउटपुटशिवाय GPU साठी TCC (टेस्ला कॉम्प्युट क्लस्टर). सह nvidia-smi तुम्ही सध्याचा मोड तपासू शकता आणि सपोर्ट असेल तेव्हा त्यांच्यामध्ये स्विच करू शकता. गेमिंग GPU असलेल्या डेस्कटॉप पीसीवर, WDDM हे सामान्य असेल; कॉम्प्युट कार्ड असलेल्या वर्कस्टेशन्सवर, टीसीसी सहसा डीफॉल्टनुसार सक्षम केले जाते..

विंडोजवर टूलकिट स्थापित करणे: चरण-दर-चरण

  1. तुमच्याकडे CUDA-सक्षम GPU आणि समर्थित Windows आवृत्ती आहे याची पडताळणी करा.डिव्हाइस मॅनेजर (डिस्प्ले अॅडॉप्टर) वरून तुम्ही निर्माता आणि मॉडेल पाहू शकता.
  2. अधिकृत डाउनलोड पृष्ठावरून NVIDIA CUDA टूलकिट डाउनलोड करा. तुमच्याकडे दोन फॉरमॅट आहेत: नेटवर्क इंस्टॉलर (फक्त इंस्टॉलेशन दरम्यान निवडलेले डाउनलोड करते) आणि फुल इंस्टॉलर (सर्व घटक समाविष्ट आहेत, ऑफलाइन किंवा एंटरप्राइझ डिप्लॉयमेंटसाठी उपयुक्त).
  3. इंस्टॉलर चालवा आणि ग्राफिकल विझार्डचे अनुसरण करा. आवश्यक असल्यास टूलकिट, उदाहरणे आणि व्हिज्युअल स्टुडिओसह एकत्रीकरण स्थापित करणे.
  4. स्वयंचलित स्थापनेत तुम्ही सायलेंट मोड वापरू शकता -sआणि विशिष्ट उपपॅकेज निवडण्यासाठी पॅरामीटर्स जोडा. ध्वज -n आवश्यक असल्यास स्वयंचलित रीस्टार्ट टाळा.
  5. पूर्ण करा आणि पुन्हा सुरू करा विनंती केल्यास.
  6. कमांड प्रॉम्प्ट उघडा आणि चालवा nvcc -V स्थापित CUDA कंपायलर आवृत्ती पाहण्यासाठी.

विंडोजवर CUDA स्थापित करा

मूक स्थापना आणि टूलकिट उपपॅकेज

इंस्टॉलर तुम्हाला टूलकिटचे विशिष्ट घटक तैनात करण्याची परवानगी देतो, जे व्यवस्थापित किंवा CI वातावरणात उपयुक्त आहे. CUDA 13.0 मधील काही प्रतिनिधी उपपॅकेट्स (डिफॉल्ट पथ C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v13.0) हे आहेत:

  • क्यूब्लास_१३.० / क्यूब्लास_देव_१३.०: cuBLAS रनटाइम लायब्ररी.
  • crt_13.0 द्वारे अधिक: CUDA अनुप्रयोगांसाठी कंपायलर.
  • ctadvisor_13.0 द्वारेसंकलन वेळ कमी करण्यासाठी NVCC/NVRTC ट्रेस विश्लेषण.
  • कुडा_प्रोफाइलर_एपीआय_१३.० y cuadrt_13.0 कडील अधिक: CUDA प्रोफाइलर आणि रनटाइम API.
  • कफ्ट_१३.० / कफ्ट_देव_१३.०: घनफूट.
  • cuobjdump_13.0 द्वारे अधिक y एनव्हीडीसास्म_१३.०: क्यूबिन तपासण्यासाठी उपयुक्तता.
  • कप्टी_१३.०: प्रोफाइलिंग टूल्स इंटरफेस.
  • क्युरंड_१३.० / क्युरंड_देव_१३.०: करंड.
  • क्युसॉल्व्हर_१३.० / क्युसॉल्व्हर_डेव्ह_१३.० y cusparse_13.0 / cusparse_dev_13.0: रेषीय बीजगणित ग्रंथालये.
  • कक्सक्सफिल्ट_१३.०: डिमँगलर cu++ फिल्टर.
  • कागदपत्रे_१३.०: HTML आणि PDF मार्गदर्शक (प्रोग्रामिंग, सर्वोत्तम पद्धती इ.).
  • एनसाईट_कॉम्प्युट_१३.०, एनसाईट_सिस्टम्स_१३.० y एनसाईट_व्हीएसई_१३.०एनसाईट टूल्स.
  • npp_13.0 / npp_dev_13.0: एनपीपी.
  • एनव्हीसीसी_१३.०CUDA कंपायलर.
  • nvfatbin_13.0 द्वारे, एनव्हीजिटलिंक_१३.०, एनव्हीटीएक्स_१३.०, एनव्हीव्हीएम_१३.०, nvptxcompiler_13.0 द्वारे: टूलचेन आणि ट्रेस टूल्स/लायब्ररी.
  • एनव्हीजेपीईजी_१३.० / एनव्हीजेपीईजी_देव_१३.०: एनव्हीजेपीईजी.
  • एनव्हीएमएल_डेव्ह_१३.०NVML हेडर आणि लायब्ररी.
  • nvprune_13.0 बद्दल: उपकरण लक्ष्यांनुसार वस्तू/स्टॅटिक्सची छाटणी.
  • ऑक्युपन्सी_कॅल्क्युलेटर_१३.०: ऑक्युपन्सी स्प्रेडशीट.
  • ओपनक्ल_१३.०: ओपनसीएल लायब्ररी.
  • सॅनिटायझर_१३.०कॉम्प्युट सॅनिटायझर API.
  • थ्रस्ट_१३.० y व्हिज्युअल_स्टुडिओ_इंटिग्रेशन_१३.०जोर आणि एकत्रीकरण VS.

जर तुम्हाला इन्स्टॉल करण्यापूर्वी त्यातील सामग्री तपासायची असेल, तर तुम्ही LZMA-सुसंगत टूल (उदा. 7-झिप) वापरून फुल इंस्टॉलर काढू शकता. टूलकिट फाइल्स CUDAToolkit फोल्डरमध्ये असतात. फाइल्स एक्सट्रॅक्ट केल्यानंतर, तुम्हाला आत .dll आणि .nvi फाइल्स सापडतील, ज्या तुम्ही फक्त इंस्टॉलेशन ट्रीची तपासणी करू इच्छित असल्यास दुर्लक्ष करू शकता. अनइन्स्टॉलेशन कंट्रोल पॅनल > प्रोग्राम्स आणि फीचर्स मधून केले जाते.

पाईप (NVIDIA व्हील्स) सह स्थापना

पायथॉन-केंद्रित वातावरणासाठी, NVIDIA व्हील्स ऑफर करते जे Pip द्वारे CUDA रनटाइम आणि लायब्ररी स्थापित करतात. हे पॅकेजेस रनटाइम वापरासाठी आहेत. आणि डेव्हलपमेंट टूल्स समाविष्ट करू नका (आवश्यक असल्यास तुम्ही ते वेगळे स्थापित करू शकता). टीप: CUDA वातावरण हे pip वातावरणात व्यवस्थापित केले जाते, म्हणून जर तुम्हाला CUDA बाहेर वापरायचे असेल तर तुम्हाला होस्ट वातावरण समायोजित करावे लागेल.

प्रथम, स्थापित करा nvidia-pyindex जेणेकरून pip NVIDIA NGC रिपॉझिटरीमधून मॉड्यूल्स सोडवू शकेल. आवश्यक असल्यास, पिप आणि सेटअप टूल्स अपडेट करा पुढील चुका टाळण्यासाठी. तुम्ही ची ओळ देखील जोडू शकता nvidia-pyindex ट्रम्प requirements.txt जर तुम्ही त्या नियमांनुसार काम करत असाल तर.

स्थापना सत्यापित करा: नमुने आणि चाचण्या

कंपायलर आवृत्ती तपासा nvcc -V सीएमडी कडून. github.com/nvidia/cuda-samples वरून CUDA नमुने क्लोन करा.रिपॉझिटरीमध्ये दर्शविल्याप्रमाणे ते संकलित करा आणि चालवा. बिल्ड आणि चालविण्याची शिफारस केली जाते deviceQuery GPU आढळले आहे आणि कॉन्फिगरेशन बरोबर आहे याची पुष्टी करण्यासाठी.

चाचणी bandwidthTest होस्ट-डिव्हाइस कार्यप्रदर्शन आणि संप्रेषण प्रमाणित करते. दोन्ही प्रकरणांमध्ये, महत्त्वाची गोष्ट म्हणजे डिव्हाइस दिसते.ते तुमच्या हार्डवेअरशी जुळते आणि चाचण्या उत्तीर्ण होते. जर deviceQuery GPU आढळला नाही, ड्रायव्हर इंस्टॉलेशन तपासा आणि डिव्हाइस सिस्टममध्ये कार्यरत आहे का ते तपासा.

Windows 11 आणि Windows 10 21H2+ मध्ये CUDA आणि WSL

विंडोज ११ आणि विंडोज १० च्या अलीकडील आवृत्त्या (२१एच२ आणि नंतरच्या) WSL वापरून GPU-अ‍ॅक्सिलरेटेड ML टूल्स चालवण्यास समर्थन देतात. तुम्ही टेन्सरफ्लो, पायटॉर्च, डॉकर आणि एनव्हीआयडीए कंटेनर टूलकिट वापरू शकाल. glibc-आधारित Linux डिस्ट्रोमध्ये (उबंटू, डेबियन, इ.).

महत्त्वाचे टप्पे: WSL मध्ये NVIDIA CUDA-सक्षम ड्राइव्हर स्थापित करा, WSL सक्षम करा आणि उबंटू/डेबियन-प्रकारचे वितरण जोडा. तुमच्याकडे WSL कर्नलची नवीनतम आवृत्ती असल्याची खात्री करा. (किमान ५.१०.४३.३). तुम्ही हे पॉवरशेलमध्ये याद्वारे सत्यापित करू शकता: wsl cat /proc/versionपुढे, NVIDIA डॉकरसोबत काम करण्यासाठी किंवा डिस्ट्रोमध्ये PyTorch/TensorFlow स्थापित करण्यासाठी WSL वापरकर्ता मार्गदर्शकामध्ये NVIDIA च्या CUDA चे अनुसरण करा.

विंडोजमध्ये तपासणी आणि निदान

तुमच्याकडे कोणता GPU आहे हे शोधण्यासाठी: सेटिंग्ज > सिस्टम > डिस्प्ले > अॅडव्हान्स्ड सेटिंग्जमध्ये, तुम्हाला “डिस्प्ले माहिती” अंतर्गत ब्रँड आणि मॉडेल मिळेल. टास्क मॅनेजरमध्ये, परफॉर्मन्स टॅबवापर, मॉडेल आणि मेमरी पाहण्यासाठी GPU निवडा. जर ते दिसत नसेल, तर डिव्हाइस मॅनेजर > डिस्प्ले अॅडॉप्टर तपासा आणि कार्डसाठी योग्य ड्रायव्हर स्थापित करा.

तुमच्या ड्रायव्हरने "रिपोर्ट केलेले" CUDA आवृत्ती पाहण्यासाठी, चालवा nvidia-smi. स्थापित केलेल्या टूलकिट कंपायलरची आवृत्ती शोधण्यासाठी, वापरते nvcc --version. ते लक्षात ठेवा nvidia-smi ते तुमच्या डिस्कवर असलेल्या टूलकिटमधील आवृत्ती नाही तर ड्रायव्हरद्वारे समर्थित कमाल CUDA “API” आवृत्ती प्रदर्शित करते.

क्लाउड वापर: GPU सह उदाहरणांची उदाहरणे

जर तुम्हाला ऑन-डिमांड पॉवरची आवश्यकता असेल, तर क्लाउड प्रोव्हायडर्स NVIDIA A100, RTX 4090, किंवा A6000 सारख्या GPU सह उदाहरणे देतात. या दृष्टिकोनामुळे तुम्ही जसे जाता तसे पैसे द्या, जवळजवळ त्वरित तैनाती आणि तयार टेम्पलेट्स मिळू शकतात. लोकप्रिय फ्रेमवर्कसाठी (पायटॉर्च, टेन्सरफ्लो). मोठ्या वर्कलोडसाठी किंवा तात्पुरत्या वाढीसाठी, मालकीच्या हार्डवेअरमध्ये गुंतवणूक न करता आणि नवीनतम CUDA आवृत्त्यांसाठी समर्थनासह हा एक कार्यक्षम पर्याय आहे.

कायदेशीर सूचना आणि ट्रेडमार्क

NVIDIA दस्तऐवजीकरण आणि सॉफ्टवेअर "जसे आहे तसे" प्रदान केले आहे, सर्व हक्क राखीव आहेत आणि विशिष्ट उद्देशासाठी व्यापारक्षमता किंवा योग्यतेची कोणतीही गर्भित हमी नाही. NVIDIA पूर्वसूचना न देता तपशील आणि कागदपत्रांमध्ये बदल करू शकते.नेहमीच नवीनतम माहितीची पडताळणी करा आणि तृतीय-पक्ष विक्री आणि परवाना अटींचा आदर करा. ओपनसीएल हा अ‍ॅपल इंक. चा ट्रेडमार्क आहे जो ख्रोनोसला परवानाकृत आहे; एनव्हीआयडीए आणि त्याचा लोगो यूएस आणि इतर देशांमध्ये नोंदणीकृत ट्रेडमार्क आहेत.

वरील सर्व गोष्टींसह, आता तुमच्याकडे विंडोजवर (आणि जेव्हा तुम्हाला गरज असेल तेव्हा WSL ​​किंवा Linux वर देखील) CUDA स्थापित करण्यासाठी, कॉन्फिगर करण्यासाठी आणि प्रमाणित करण्यासाठी आवश्यक घटक आहेत. आवश्यकता आणि ड्रायव्हर्सपासून ते व्हिज्युअल स्टुडिओसह एकत्रीकरण आणि नमुन्यांसह पडताळणीपर्यंतमुख्य म्हणजे ड्रायव्हर आवृत्ती, टूलकिट आणि वातावरण संरेखित करणे आणि सारख्या साधनांवर अवलंबून राहणे nvidia-smi, nvcc आणि संपूर्ण साखळी अपेक्षेप्रमाणे काम करते याची पुष्टी करण्यासाठी नमुने.