गुगल नॅनो बनाना: ते काय आहे, ते कसे कार्य करते आणि जेमिनीवर ते कसे वापरावे

  • नॅनो बनाना हे जेमिनी अॅपमध्ये समाविष्ट केलेल्या जेमिनी २.५ फ्लॅश इमेजचे टोपणनाव आहे.
  • विषयाची ओळख जपून नैसर्गिक भाषेत संपादन आणि रचना करा.
  • अंतिम वापरकर्त्यांसाठी मोफत; व्यवसायांसाठी टोकन-आधारित API.

गुगल एआय सह प्रतिमा संपादन

नाव "नॅनो बनाना" व्हायरल झाला आहे. नेटवर्क्स आणि टेक फोरममध्ये, परंतु टोपणनावामागे कोणतेही स्वतंत्र उत्पादन नाही: ते बोलचालीच्या पद्धतीने बाप्तिस्मा घेतले गेले आहे. मिथुन २.५ फ्लॅश इमेज, गुगलचे एआय-संचालित फोटो जनरेशन आणि एडिटिंग मॉडेल जे आता जेमिनी अॅपमध्ये आहे. हा प्रस्ताव त्याच्या नैसर्गिक भाषा हाताळणी आणि आवृत्त्यांमध्ये दृश्य सुसंगतता राखण्यासाठी.

या वैशिष्ट्याचे मोठे वचन म्हणजे परवानगी देणे जलद आणि अचूक संपादने डिझाइनचे ज्ञान नसलेले. नैसर्गिक भाषेच्या सूचनांसह, जेमिनी आदेशाचे अर्थ लावतो आणि काही सेकंदात बदल लागू करतो, विषयाच्या ओळखीचा आदर करणे आणि शूटिंग शैली. यामुळे दुर्मिळ कलाकृती कमी होतात आणि मागील पिढ्यांच्या मॉडेल्सपेक्षा अधिक अचूक परिणाम मिळतात.

नॅनो बनाना खरोखर काय आहे आणि ते का महत्त्वाचे आहे

अंतर्गत चाचणी दरम्यान, गुगलने अनौपचारिक नाव वापरले "नॅनो बनाना" म्हणजे जेमिनी २.५ फ्लॅश इमेजचा संदर्भ.त्याच्या घोषणेनंतर, हे मॉडेल वेब आणि मोबाइल दोन्हीवर जेमिनी अॅपमध्ये मूळतः एकत्रित केले गेले. त्याचे ध्येय: प्रतिमा संपादित करा, तयार करा आणि तयार करा संभाषणात्मकदृष्ट्या, फरक निर्माण करणारे बारकावे आणि तपशील समजून घेण्यासाठी मिथुन संदर्भाचा फायदा घेणे.

या साधनाला पर्यायांपेक्षा एक पाऊल पुढे ठेवणारी गोष्ट म्हणजे त्याची क्षमता वैशिष्ट्ये, शैली आणि सुसंगतता राखणे अनेक बदलांमध्ये. जेव्हा तुम्ही एकाच व्यक्तीला, पाळीव प्राण्याला किंवा वस्तूला अनेक आवृत्त्यांमध्ये बदलता तेव्हा सिस्टम दृश्यमान ओळख उल्लेखनीय अचूकतेने जपते, "जवळजवळ सारखेच" क्लासिक टाळणे जे एक विचित्र भावना सोडते.

संपादनाव्यतिरिक्त, मॉडेल खालील कार्ये जोडते: निर्मिती आणि रचना: तुम्हाला मजकुरापासून सुरुवात करून सुरवातीपासून प्रतिमा तयार करण्याची, अनेक फोटो एका सुसंगत दृश्यात एकत्र करण्याची किंवा शैली हस्तांतरित करा प्रतिमांमधील. हे सर्जनशील मोहिमा, कॉमिक्स, वैयक्तिकृत कार्ड किंवा उत्पादन छायाचित्रण क्लासिक सॉफ्टवेअरची गरज नसताना.

गुगलने सार्वजनिक उदाहरणांमध्ये ही सुसंगतता दाखवली आहे. एका प्रात्यक्षिकात, ते असे सोपे काहीतरी सुचवते: "अनेक फोटो अपलोड करा आणि ते एकत्र करण्यास सांगा."प्रत्येकाकडून काय ठेवावे आणि त्यांना कसे ठेवावे हे सिस्टीमला समजते, ज्यामुळे तुम्हाला काय बदलायचे किंवा ठेवावे हे फाइन-ट्यून करता येते.

गुगल नॅनो बनाना

उपलब्धता, किंमत आणि साठवणूक

ग्राहकांचा वापर म्हणजे जेमिनी अ‍ॅपमध्ये मोफत. तुम्हाला एखादा विचित्र मोड सक्रिय करण्याची किंवा मॉडेल निवडण्याची गरज नाही: फक्त प्रतिमा अपलोड करा आणि तुमच्या स्वतःच्या शब्दात एक्सचेंजची विनंती करा, आणि बस्स. गुगल सूचित करते की ते अस्तित्वात आहेत. वापराच्या सामान्य मर्यादा जे कालांतराने अपडेट केले जातात, त्यामुळे मोठ्या प्रमाणात उपलब्धता गतिमानपणे व्यवस्थापित केली जाते.

व्यवसाय आणि विकासकांसाठी, व्यावसायिक प्रवेश याद्वारे येतो Google AI स्टुडिओ आणि Vertex AI. त्या वातावरणात, टोकन बिलिंग दिले जाते: इमेज आउटपुट मॉडेलची किंमत प्रति दशलक्ष टोकन $३०, ज्याचे Google साधारणपणे भाषांतर करते प्रत्येक जनरेट केलेल्या प्रतिमेसाठी $०.०२९ परिभाषित पॅरामीटर्समध्ये. ही एक योजना आहे जी खर्च नियंत्रण न गमावता व्यावसायिक एकत्रीकरण वाढवण्यासाठी डिझाइन केलेली आहे.

आणखी एक व्यावहारिक पैलू म्हणजे प्रतिमा साठवण्याचा कालावधी. फ्री मोडमध्ये, प्रतिमा यासाठी ठेवल्या जातात 15 दिवस, तर पेमेंट खात्यांमध्ये धारणा वाढते 140 दिवसही विंडो तुम्हाला तात्काळ बाह्य रिपॉझिटरी व्यवस्थापित न करता जेमिनीमधील मटेरियलवर पुनरावृत्ती सुरू ठेवण्याची परवानगी देते.

सोप्या सूचनांसह संपादन: कसे कार्य करावे

तत्वज्ञान असे आहे की तुम्हाला मास्क, थर किंवा निवडींबद्दल माहिती असण्याची गरज नाही.तुम्ही "ते काळा आणि पांढरा करा," "पार्श्वभूमीतून वस्तू काढा," "आकाश स्वच्छ करा," किंवा "मला गुलाबी निऑन दिवे असलेल्या रेट्रो कॅफेमध्ये ठेवा," अशा विनंत्या लिहू शकता आणि मॉडेल प्रकाशयोजना आणि दृष्टीकोनाचा आदर करून ते संपादित करेल. गैरसमज टाळण्यासाठी, सुरुवातीला ते खूप चांगले काम करते. "मूळ फोटोमध्ये, ..." जेव्हा तुम्हाला बेस सीन राखला गेला आहे यावर जोर द्यायचा असेल.

सोप्या कामांमध्ये, सिस्टम पहिल्या प्रयत्नातच कार्य करते: रंग समायोजित करा, काळा आणि पांढरा वर जा किंवा प्रकाशाचे तापमान सुधारित करा. अधिक सर्जनशील विनंत्यांसाठी, घटक जोडून किंवा बदलून प्रतिसाद द्या: वस्तू हटवा आणि पार्श्वभूमी पुन्हा तयार करते, बदलते रंग, केशरचना किंवा कपडे, जोडा चष्मा किंवा टोपी, आणि तुमचे रूपांतर देखील करा डायनासोरवर मांजर जर तुम्ही तेच शोधत असाल तर.

एक विशेषतः शक्तिशाली वैशिष्ट्य म्हणजे दोन प्रतिमा विलीन करा एका फोटोतील मजकूर दुसऱ्या फोटोमध्ये घालण्यासाठी. उदाहरणार्थ, तुम्ही पहिल्या फोटोतील कागदाचा तुकडा धरू शकता आणि दुसऱ्या फोटोतील चित्राने त्याऐवजी चित्र बदलण्यास सांगू शकता, फ्रेमिंग आणि लाईटिंग जतन करणे ते खरे दिसण्यासाठी मूळ.

ते खूप नैसर्गिक देखील वाटते. निधी बदला: कोणत्याही रस्त्यावरून उष्णकटिबंधीय समुद्रकिनाऱ्यावर, धुक्याच्या जंगलात किंवा भविष्यकालीन शहरात जा. मॉडेलला खोली समजते आणि दृश्य भूमिती, आणि विषयाला समजण्याजोग्या सावल्या आणि स्वरांसह जुळवून देतो.

नॅनो केळी

प्रत्येक आवृत्तीत विषयाची ओळख जपा.

गुणात्मक झेप ही आहे की पोर्ट्रेटची सुसंगतता. जर तुम्ही एकाच व्यक्तीला किंवा पाळीव प्राण्याला अनेक वेळा पुन्हा स्पर्श केला - कपडे, पार्श्वभूमी किंवा काळ बदलला - तर हे साधन ते करू शकते "तू असच राहा". हे फक्त डोळे किंवा केशरचना सारख्या दिसण्याबद्दल नाही: प्रणाली प्रमाणांची काळजी घेते, विशिष्ट वैशिष्ट्ये आणि देखावा, जे जादू मोडणारी "वाजवी साम्य" ची भावना टाळते.

गुगलने अधोरेखित केले आहे की ही सुधारणा एआय एडिटिंगमधील एका क्लासिक समस्येचे निराकरण करते: प्रमुख वैशिष्ट्ये अबाधित ठेवा उर्वरित फोटो बदलताना विषयाचे. जेमिनीच्या संदर्भात्मक समजुतीमुळे, अंतिम प्रस्तुतीकरण वातावरण नवीन असतानाही त्याची ओळख टिकवून ठेवते, मग ते वॉलपेपरसह बैठकीची खोली वेगळे किंवा धाडसी साठच्या दशकातील लूक.

संपादन केल्यानंतर, तुम्ही हे देखील करू शकता रिटच केलेली प्रतिमा अपलोड करा पुन्हा मिथुन राशीला ते अ मध्ये बदलण्यासाठी लहान व्हिडिओ त्याच कारणास्तव. स्वरूपांमधील ही सातत्य अनेक साधनांना जोडण्याची आवश्यकता न ठेवता सोशल मीडिया, जाहिराती किंवा सादरीकरणांचा वापर वाढवते.

"कपड्यांचे कपडे बदलणे" किंवा "स्थान बदलणे" हे एक सामान्य उदाहरण आहे: तुम्ही स्वतःचा किंवा तुमच्या कुत्र्याचा फोटो अपलोड करता आणि वेगवेगळ्या शैली, ठिकाणे किंवा वेळा विचारता, न गमावता अचूक साम्यहे एक मजेदार, वेगवान आणि सर्वात महत्त्वाचे म्हणजे, एकामागून एक सुसंगत प्रवाह आहे.

काम करण्याच्या पद्धती: निर्मिती, संपादन आणि रचना

ही प्रणाली अनेक प्रवाहांना समर्थन देते: प्रतिमेसाठी मजकूर सुरवातीपासून निर्माण करणे; प्रतिमा + मजकूर विशिष्ट भाग संपादित करण्यासाठी; आणि एकाच वेळी अनेक प्रतिमा नवीन दृश्ये तयार करण्यासाठी किंवा शैली हस्तांतरित करण्यासाठी. सर्व बाबतीत, तुम्ही हे करू शकता आळीपाळीने पुनरावृत्ती करा बारीक तपशील समायोजित करण्यासाठी आणि अंतिम आवृत्तीवर पोहोचण्यासाठी.

जेव्हा प्रतिमेमध्ये मजकूर (पोस्टर किंवा आकृती) असतो, तेव्हा मॉडेल एक बनवते सुवाच्य आणि सुव्यवस्थित प्रस्तुतीकरण, जे ब्रँडिंग मटेरियलसाठी उपयुक्त आहे. याव्यतिरिक्त, सर्व जनरेट केलेल्या प्रतिमांमध्ये समाविष्ट आहे सिंथआयडी वॉटरमार्क, एक तांत्रिक सिग्नल जो दर्शवितो की ते AI वापरून तयार केले गेले आहेत.

जर तुम्ही API द्वारे प्रतिमा अपलोड करणार असाल, तर खालील गोष्टी समर्थित आहेत: बेस६४ अपलोड आणि अनेक फायलींसह मोठे अपलोड. वापराचे नियम लक्षात ठेवणे महत्वाचे आहे: तुम्हाला अधिकार असले पाहिजेत. तुम्ही काय अपलोड करता यावर लक्ष ठेवा आणि फसवणूक करणारा, त्रास देणारा किंवा हानी पोहोचवणारा मजकूर टाळा. सुरक्षेचा हा स्तर सेवेचा अविभाज्य भाग आहे.

एक व्यावहारिक टीप: जर तुम्हाला मजकुरासह प्रतिमा हव्या असतील तर ते सहसा चांगले काम करते. प्रथम मजकूर तयार करा आणि नंतर प्रतिमा एम्बेड करण्यासाठी विचारा. आणि अनेक इनपुटसाठी, इष्टतम कामगिरी येते 3 पर्यंत प्रतिमा संपादन संदर्भ म्हणून.

नॅनो केळी

काम करणाऱ्या त्वरित रणनीती

सर्वोत्तम नियम म्हणजे वर्णन करणे पूर्ण दृश्य, एकच शब्द एकत्र जोडू नका. सेटिंग, कॅमेरा, प्रकाशयोजना आणि शैली निर्दिष्ट करणारा कथनात्मक परिच्छेद निर्माण करतो अधिक सुसंगत निकाल टॅग्जच्या यादीपेक्षा.

फोटोरिअलिझमसाठी, उल्लेख करा कॅमेरा अँगल, लेन्स आणि प्रकाशयोजना ("वाइड-अँगल शॉट, बॅकलिट, दुपारचा प्रकाश, उबदार त्वचेचा रंग"). ग्राफिक मालमत्तांसाठी, शैली आणि विनंतीबद्दल स्पष्ट रहा. पारदर्शक पार्श्वभूमी जेव्हा तुम्हाला आयकॉन किंवा स्टिकर्सची आवश्यकता असेल.

हे स्पष्ट करण्यास देखील मदत करते की उद्देश: "एका उच्च दर्जाच्या मिनिमलिस्ट ब्रँडसाठी लोगो तयार करा" हे सामान्य "लोगो बनवा" पेक्षा चांगले परिणाम देते. गुंतागुंतीच्या दृश्यांचे विभाजन करा. प्रगतीशील पावले: प्रथम पार्श्वभूमी, नंतर मुख्य घटक आणि शेवटी तपशील किंवा अंतिम प्रकाशयोजना.

"कार-मुक्त" ऐवजी, प्रयत्न करा अर्थपूर्ण नकारात्मक सूचना सकारात्मक स्वरूपात मांडले: "वाहतूक चिन्हे नसलेला रिकामा, निर्जन रस्ता." आणि तो भाषेच्या मदतीने रचना नियंत्रित करतो छायाचित्रणात्मक किंवा सिनेमॅटोग्राफिक ("क्लोज-अप शॉट", "कमी दृष्टीकोन", "केंद्रित गायब बिंदू").

मर्यादा, भाषा आणि सुरक्षितता

सर्वोत्तम भाषिक कामगिरी साध्य करण्यासाठी, मॉडेल उत्कृष्ट आहे EN, es-MX, ja-JP, zh-CN आणि hi-IN. जरी ते प्रतिमांसह कार्य करते, तरी ते इनपुटना समर्थन देत नाही ऑडिओ किंवा व्हिडिओ नाही प्रतिमा निर्मितीमध्ये. आणि ते नेहमीच मिलिमीटरचे अनुसरण करू शकत नाही प्रतिमांची अचूक संख्या जर तुम्ही एकाच प्रॉम्प्टमध्ये खूप कठोर गणना सक्ती केली तर विनंती.

नियामक क्षेत्रात, प्रादेशिक निर्बंध आहेत: उदाहरणार्थ, EEA, स्वित्झर्लंड आणि युनायटेड किंग्डममध्ये अल्पवयीन मुलांचे फोटो अपलोड करता येत नाहीत. सध्या तरी. या टूलमध्ये सुरक्षा उपायांचा समावेश आहे आणि सर्व जनरेट केलेली सामग्री आहे सिंथआयडी जबाबदार ट्रेसेबिलिटीसाठी.

तसेच पालन करायला विसरू नका प्रतिबंधित वापर धोरण आणि खात्री करा की तुमच्याकडे आहे प्रतिमा अधिकार तुम्ही अपलोड करता. ही मार्गदर्शक तत्त्वे निर्माते आणि अंतिम वापरकर्ते दोघांचेही संरक्षण करतात आणि अनुभवाचा भाग आहेत.

दैनंदिन जीवनात, संपादन विशेषतः चांगले कार्य करते तीन प्रतिमांपर्यंत सुरुवातीपासून. जर तुम्हाला तुमच्या रचनेत मजकूर समाविष्ट करायचा असेल, तर प्रथम प्रत मिळवणे आणि नंतर ती प्रतिमेत समाविष्ट करणे सहसा देते चांगले टायपोग्राफी आणि प्लेसमेंट.

उच्च-स्तरीय निकालांसाठी व्यावसायिक टिप्स

  • जेव्हा तुम्हाला जतन करण्याची काळजी असते उच्च-निष्ठा तपशील —एक चेहरा, एक लोगो—संपादन विनंतीसह त्यांचे अचूक वर्णन करा. अचूक रंग, पोत आणि भिन्न वैशिष्ट्ये विषयाचे काळजीपूर्वक विश्लेषण करा जेणेकरून मॉडेल त्याच्या जतनाला प्राधान्य देईल.
  • पहिल्या प्रयत्नातच थांबू नका: लहान संदेशांसह पुनरावृत्ती करा जसे की "सर्व काही तसेच ठेवा, पण..."संभाषणात्मक संपादनाचे ते जलद "चांगले, पण अधिक..." चक्र चमकते. प्रकाश, अभिव्यक्ती, फ्रेमिंग आणि रंगसंगतीचे पदवीधर होणे अधिक उत्पन्न देते पॉलिश केलेले आणि सुसंगत.
  • गुंतागुंतीच्या दृश्यांचे टप्प्याटप्प्याने विभाजन करा: “प्रथम जंगलाची पार्श्वभूमी पहाटे धुक्यासह; नंतर समोर शेवाळ असलेली दगडी वेदी; शेवटी, वेदीवर एक चमकणारी तलवार.” या क्रमिक विभाजनामुळे मॉडेलसाठी काम सोपे होते. मिश्रणात हरवू नका. आणि घटकांना चांगले खिळे लावतो.
  • जर तुम्हाला प्रेझेंटेशनमध्ये किंवा वेबवर वापरता येणारे ग्राफिक संसाधन हवे असेल तर ते मागा. किमान डिझाइन आणि शीर्षकांसाठी "ऋण जागा". स्वच्छ पार्श्वभूमी आणि पुरेसा कॉन्ट्रास्ट सुनिश्चित करा, जेणेकरून तुम्ही नंतर ओव्हरले मजकूर वाचनीयतेशी संघर्ष न करता.

नॅनो बनाना — मॉडेलचे टोपणनाव मिथुन २.५ फ्लॅश इमेज— ने त्याची प्रतिष्ठा मिळवली आहे: ते सूचनांद्वारे नैसर्गिक संपादन, फोटो विलीनीकरण, ओळख सुसंगतता आणि जेमिनीमध्ये विनामूल्य प्रवेश प्रदान करते; ज्यांना स्केलिंगची आवश्यकता आहे त्यांच्यासाठी प्रवेश आहे Google AI स्टुडिओ आणि Vertex AI टोकन किंमतीसह. ज्ञात मर्यादांमध्ये भाषा प्राधान्य, जास्तीत जास्त तीन इनपुट प्रतिमा आणि नियामक निर्बंध समाविष्ट आहेत; त्या बदल्यात, प्रवाह सुरळीत आहे, गुणवत्ता उच्च आहे आणि वॉटरमार्क जबाबदार वापर सुनिश्चित करतो.