NameRate कैसे काम करता है
NameRate की नींव एक अनव्याख्येय मशीन लर्निंग मॉडल पर आधारित है, जिसे अतिरिक्त डेटा के आधार पर लगातार पुनः प्रशिक्षित किया जाता है। जब एक नया परीक्षण मॉडल स्थिर हो जाता है, तो वह मुख्य मॉडल को बदल देता है और प्रशिक्षण नए परीक्षण मॉडल में जारी रहता है।
डेटा कहाँ से एकत्र किया जाता है
1. निकनेम बिक्री के प्लेटफ़ॉर्म
ऐसे स्रोतों के सार्वजनिक डेटा, जहाँ निकनेम और डोमेन बेचे जाते हैं।
आज के मुख्य स्रोत हैं:
क्या विश्लेषण किया जाता है?
- सफल सौदे: बिक चुके निकनेम, उनके मूल्य और बिक्री की गति।
- असफल लिस्टिंग: निकनेम जो खरीदार नहीं पा सके और इसके कारण (मूल्य, कम मांग आदि)।
- विषयों की लोकप्रियता: मांग वाले श्रेणियाँ, जैसे कि व्यवसाय, क्रिप्टो या नाम।
2. बाजार रुझान
NameRate उन बाहरी डेटा का विश्लेषण करता है जो शब्दों और वाक्यांशों की लोकप्रियता से संबंधित हैं। इसके लिए उपयोग किए जाते हैं:
- सर्च इंजन नीलामियाँ: संदर्भ विज्ञापन के लिए उपयोग किए जाने वाले आँकड़े।
- ऑनलाइन स्रोत: इंटरनेट प्रकाशनों में लोकप्रिय शब्द, अक्सर उल्लेखित वाक्यांश।
- सोशल नेटवर्क: Telegram, Twitter और अन्य प्लेटफ़ॉर्म पर चल रहे रुझान और प्रमुख विषय।
- पॉप कल्चर और साहित्य: ऐसे शब्द और अभिव्यक्तियाँ जो पॉप कल्चर, किताबों या फिल्मों में अक्सर देखी जाती हैं।
3. NameRateBot के माध्यम से उपयोगकर्ता वरीयताएँ
प्रत्यक्ष प्रशिक्षण डेटा की विशाल मात्रा के बावजूद, बिक्री के डेटा अभी भी पर्याप्त नहीं हैं ताकि एल्गोरिदम का गुणवत्ता-सम्मत सत्यापन किया जा सके।
इसीलिए, हमने उपयोगकर्ताओं की राय प्राप्त करने के लिए Telegram एप्लिकेशन @NameRateBot लॉन्च किया है। हमारे लिए यह बहुत ही कीमती ज्ञान स्रोत है, जिसका उपयोग हम मूल्यांकन की गुणवत्ता की जांच के लिए करते हैं। और उपयोगकर्ताओं के लिए यह हमारे टोकन प्राप्त करने का एक अच्छा तरीका है।
अभी एक tinder-जैसी मैकेनिज्म जोड़ी गई है:
- उपयोगकर्ता निकनेम को दाएँ (पसंद) या बाएँ (नापसंद) स्वाइप करते हैं
- प्रत्येक स्वाइप मॉडल के वज़न की वैधता में मदद करता है
- उपयोगकर्ताओं को $NMRT में इनाम मिलता है
वर्तमान में केवल स्वाइप मैकेनिज्म जोड़ा गया है, पर अगली परीक्षण मॉडल में सुधार के लिए हम अन्य मैकेनिज्म भी जोड़ेंगे, जैसे कि:
- उपयोगकर्ता इनपुट के साथ मैकेनिज्म (1)
- जोड़ीवार तुलना के साथ मैकेनिज्म (2)
- यह उपयोगकर्ताओं के मन में आने वाले विचारों को कैप्चर करता है
- यह मूल्यांकन की सटीकता बढ़ाता है
धोखाधड़ी से बचाव के लिए
- स्वाइप सीमा: प्रति दिन अधिकतम 10 स्वाइप, ताकि हेरफेर न हो
- असामान्य पैटर्न का विश्लेषण: यदि कोई उपयोगकर्ता बहुत तेज़ या अव्यवस्थित तरीके से निकनेम का मूल्यांकन करता है, तो ऐसे डेटा को बाहर कर दिया जाता है
एल्गोरिदम के सिद्धांत
NameRate एक अनव्याख्येय ML मॉडल है। इसका मतलब है कि यह ठीक से नहीं बताया जा सकता कि एल्गोरिदम ने कोई विशेष मूल्यांकन क्यों दिया। नीचे हम एक उदाहरण देंगे जो दिखाता है कि मुख्य सिद्धांत और सबसे प्रभावशाली विशेषताएँ कैसे काम कर सकती हैं।
विशेषताएँ और उनके वजन बदलते रहते हैं जब भी मॉडल का नया संस्करण जारी होता है।
वर्तमान एल्गोरिदम नीचे दी गई सभी विशेषताओं का उपयोग करता है, परन्तु केवल इन्हीं तक सीमित नहीं है। विशेषताओं की व्याख्या केवल संदर्भ के लिए दी गई है (1)
- हमारे प्रोटोटाइप ने इसी प्रकार काम किया था।
उदाहरण
कुछ ऐसे पहलू जिनका प्रभाव अधिक होता है:
निकनेम की लंबाई
जितना छोटा, उतना बेहतर:
@root या @final @longnickname123 की तुलना में अधिक मूल्यवान हैं
अक्षरहीन प्रतीक: जैसे कि अंक या अंडरस्कोर
निकनेम में संख्याएँ मूल्य कम करती हैं:
@josephine @josephine12345 की तुलना में बेहतर है
हालांकि, यदि संख्या अर्थ जोड़ती है (जैसे कि @peer2peer या @season4), तो निकनेम का वजन बढ़ जाता है
दोहराव
आम तौर पर, अक्षरों का दोहराव मूल्य कम कर देता है:
@eeenemy अत्यधिक दोहराव के कारण मूल्य कम हो जाता है। अपवाद: जब दोहराव किसी अर्थपूर्ण शब्द का हिस्सा हो
रोचक बात यह है कि अर्थपूर्ण शब्दों के दोहराव का मूल्यांकन पर लगभग कोई प्रभाव नहीं पड़ता
सामंजस्यपूर्ण अर्थ
वास्तविक शब्द और वाक्यांश अधिक मूल्यवान होते हैं
@space_jaguar @qazws_jaguar की तुलना में बेहतर है
लोकप्रियता: खोज, साहित्य या सोशल नेटवर्क में चल रहे रुझान
अधिक लोकप्रिय = बेहतर
@blockchain, @meta_boom या @music उनकी लोकप्रियता के कारण उच्च मूल्यांकन प्राप्त करते हैं
रुझानों को स्थिर और गतिशील में विभाजित किया जाता है, साथ ही उनके स्रोतों के आधार पर भी।
विषयगतता: विषय का मूल्य रुझान और खोज विज्ञापन नीलामी द्वारा निर्धारित होता है।
शब्दकोश
हम यह निर्धारित करने के लिए विषयगत शब्दकोश बनाते और अपडेट करते हैं कि निकनेम किस श्रेणी से संबंधित है।
उदाहरण के लिए: व्यापार, क्रिप्टोकरेंसी, पॉप कल्चर, नाम आदि। पहले स्तर के शब्दकोशों में दूसरे स्तर के शब्दकोश होते हैं।
एक कम लोकप्रिय निकनेम भी लोकप्रिय विषय का हिस्सा हो सकता है और इसके विपरीत भी
उदाहरण: @zkevmbidge इंटरनेट पर लगभग उल्लेखित नहीं होता – जिससे इसका मूल्य कम हो जाता है। हालांकि, यदि यह महंगे विषय – ब्लॉकचेन – से संबंधित है, तो इसका मूल्य बढ़ जाता है।
भौगोलिक संदर्भ: ये सकारात्मक और नकारात्मक दोनों प्रभाव डालते हैं
@NYC_blah या @London_example को अतिरिक्त भौगोलिक विशेषताओं का प्रभाव मिलेगा
यह उन सबसे स्पष्ट और समझने योग्य विशेषताओं की सूची है जिनका प्रभाव अधिक होता है। इसके अलावा, कुछ विशेषताएँ हैं जिन्हें समझना कठिन है (जैसे कि बिक्री इतिहास), अस्थिर विशेषताएँ और वे जिनको हम साझा करने के लिए तैयार नहीं हैं। वर्तमान गणना उपरोक्त निष्कर्षों को ध्यान में नहीं रखती, भले ही वे स्पष्ट हों। आप हमें बहुत मदद करते हैं जब आप ऐप में ईमानदारी से उन नामों पर वोट करते हैं जिन्हें आप अच्छा मानते हैं। हमने जानबूझकर "अच्छे" निकनेम के मानदंड नहीं दिए हैं ताकि आप अपनी भावनाओं के अनुसार उत्तर दें।