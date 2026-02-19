क्या AI सच में अपने आप सीख रहा है? जानिए भारत के छोटे शहरों में बैठे उन लाखों डेटा एनोटेटर्स की कहानी, जो कम वेतन में AI को 'इंटेलिजेंट' बना रहे हैं। जानिए कौन हैं 'डिजिटल मजदूर' जो AI को बना रहे इंटेलिजेंट?

जहां दुनिया इस बहस में उलझी है कि AI नौकरियां छीनेगा या नहीं, वहीं झांसी, इंदौर, और कोयंबटूर जैसे भारत के टियर-2 और टियर-3 शहरों में एक नई 'डिजिटल वर्कफोर्स' चुपचाप जन्म ले चुकी है। ये वे लोग हैं जो डेटा लेबलिंग और एनोटेशन के जरिए मशीनों को 'देखना' और 'सोचना' सिखा रहे हैं। लेकिन क्या यह 'AI क्रांति' का हिस्सा हैं या सिर्फ सस्ते श्रम का नया स्रोत?

सबसे पहले- कौन है यह 'अदृश्य सेना'? मशीन लर्निंग मॉडल अपने आप नहीं सीखते। उन्हें लाखों तस्वीरों और टेक्स्ट को पहचानने के लिए इंसानी मदद चाहिए होती है।

काम का स्वरूप: एक वीडियो में 'ट्रैफिक सिग्नल' को मार्क करना, किसी वाक्य में 'गुस्से' या 'प्यार' के भाव को टैग करना, या मेडिकल स्कैन में ट्यूमर की पहचान करना। इमेज में कार, पेड़, व्यक्ति को बॉक्स से घेरना, ऑडियो ट्रांसक्राइब करना और चैटबॉट के जवाबों को रैंक करना आदि। यह काम डेटा लेबलिंग / एनोटेशन कहलाता है।

स्थान: अब यह काम सिलिकॉन वैली से निकलकर भारत के उन छोटे शहरों में पहुंच गया है जहां इंटरनेट सस्ता है और श्रम उससे भी सस्ता। भारत में यह काम 90% से ज्यादा टियर-2 और टियर-3 शहरों जैसे पटना, जयपुर, लखनऊ, रांची, विशाखापट्टनम, कोच्चि, छोटे कस्बों में होता है।

टियर-2 और टियर-3 शहरों का 'डेटा हब' बनना बड़ी टेक कंपनियां अब महानगरों के बजाय छोटे शहरों का रुख कर रही हैं। क्योंकि यहां ऑफिस का किराया और वेतन बेंगलुरु या दिल्ली के मुकाबले 40-50% तक कम होता है। युवाओं को लगता है कि वे 'हाई-टेक' काम कर रहे हैं, जबकि असल में यह बार-बार दोहराया जाने वाला काम है जिसमें करियर ग्रोथ की संभावनाएं सीमित हैं।

भारत में डेटा लेबलिंग का बाजार भारत में डेटा लेबलिंग मार्केट तेज़ी से बढ़ रहा है, जो AI अपनाने की वजह से है। ग्रांड व्यू रिसर्च की एक रिपोर्ट का अनुमान है कि 2023 में 80.9 मिलियन डॉलर से बढ़कर 2030 तक 492.4 मिलियन डॉलर का रेवेन्यू हो जाएगा, जो 29.4% की CAGR से बढ़ेगा। एक बड़े ग्लोबल हब के तौर पर, भारत में 416,000 से ज्यादा AI प्रोफेशनल्स के साथ स्किल्ड स्पेशल वेंडर्स हैं।

'एल्गोरिदमिक पक्षपात' का मसला हालांकि अब यह केवल श्रम का मुद्दा नहीं है, यह 'एल्गोरिदमिक पक्षपात' का मसला है। अगर डेटा लेबल करने वाला व्यक्ति किसी खास सामाजिक परिवेश या छोटे शहर से आता है, तो उसकी सोच और पूर्वाग्रह अनजाने में उस AI मॉडल में फीड हो जाते हैं जिसे पूरी दुनिया इस्तेमाल करेगी। आज आप जो AI रिजल्ट देख रहे हैं, उसे किसी छोटे शहर के एक कमरे में बैठे युवक की 'नजर' से फिल्टर किया गया है।

एल्गोरिदमिक पक्षपात तब होता है जब AI या मशीन लर्निंग सिस्टम भेदभावपूर्ण डेटा या त्रुटिपूर्ण प्रोग्रामिंग के कारण व्यवस्थित रूप से गलत, अनुचित या पक्षपाती परिणाम जनरेट करते हैं। यह पूर्वाग्रह, नस्ल, लिंग, या उम्र के आधार पर कुछ समूहों के खिलाफ भेदभाव कर सकता है, जैसे भर्ती प्रक्रिया, ऋण अनुमोदन, या स्वास्थ्य सेवाओं में, क्योंकि एआई मानव पूर्वाग्रहों को सीखकर उन्हें दोहराता है।

'डिजिटल लेबर' वाला क्षेत्र? विशेषज्ञों का मानना है कि इस क्षेत्र को 'डिजिटल लेबर' के रूप में पहचान देनी होगी। डेटा लेबलिंग को कुशल श्रम की श्रेणी में रखकर उचित वेतन तय हो। दिन भर हिंसक या आपत्तिजनक कंटेंट को फिल्टर करने वाले एनोटेटर्स के लिए अनिवार्य मानसिक स्वास्थ्य सहायता मिले। इसके अलावा, टेक कंपनियां खुलासा करें कि उनके मॉडल को 'ट्रेन' करने वाले श्रमिकों की कार्यस्थितियां क्या हैं।

भारत का डेटा एनोटेशन बाजार तेजी से बढ़ रहा है NASSCOM की रिपोर्ट के अनुसार, भारत का डेटा एनोटेशन बाजार 2030 तक तेजी से बढ़ने की उम्मीद है, जिसमें 60% से अधिक कार्यबल छोटे शहरों से आने की संभावना है। हालांकि Rest of World जैसी टेक पत्रिकाओं की रिपोर्ट्स के अनुसार, कई एनोटेटर्स को प्रति घंटे 100 से 150 रुपये के बीच मिलता है। हालांकि कुछ लोगों का कहना है कि ये काम ज्यादा समय तक नहीं रहेगा और एआई खुद अपने काम कर लेगा। लेकिन प्रमाणिक तौर पर यह कहना मुश्किल है कि भविष्य में 'ऑटो-लेबलिंग' (AI द्वारा AI को सिखाना) इस मानव श्रम को पूरी तरह खत्म कर देगी या नहीं। कुछ विशेषज्ञ मानते हैं कि जटिल डेटा के लिए इंसानी जरूरत हमेशा बनी रहेगी।

1. क्या डेटा लेबलिंग एक स्थायी करियर है और कौन सी कंपनियां ये काम कर रही हैं? फिलहाल यह एक 'एंट्री लेवल' की नौकरी है। इसमें टिके रहने के बजाय इसे स्किल सीखने के एक माध्यम के रूप में देखना चाहिए, क्योंकि तकनीक विकसित होने पर सरल लेबलिंग का काम AI खुद करने लगेगा। प्लेटफॉर्म्स जैसे Appen, Clickworker, Desicrew, या भारतीय कंपनियां (iMerit, TaskMonk) ये काम कर रही हैं। बेसिक कंप्यूटर/स्मार्टफोन और इंटरनेट चाहिए। टियर-2/3 में लोकल आउटसोर्सिंग सेंटर भी हैं। लेकिन काम करने से पहले उनका कॉन्ट्रैक्ट पढ़ें, पेमेंट टर्म्स चेक करें और स्कैम से बचें।

2. क्या इसमें काम करने वालों को AI विशेषज्ञ माना जा सकता है? नहीं। यह 'डिजिटल असेंबली लाइन' की तरह है। एक AI इंजीनियर मॉडल बनाता है, जबकि एक लेबलर उस मॉडल के लिए 'ईंधन' (डेटा) तैयार करता है। दोनों के कौशल और वेतन में जमीन-आसमान का अंतर है।