AI का मातृभाषा के जरिए आर्थिक सम्बल

Economic support of AI through mother tongue

बिली पेरिगो। 

यह स्टार्टअप (startup) उन लाखों लोगों की मदद के लिए आगे आया है जिनकी मातृभाषाएं  हाशिए पर हैं। एआई (startup)से उन्हें आर्थिक लाभ हो सकेगा।

नारियल पेड़ की छाया में, चंद्रिका सूरज की रोशनी से बचने के लिए अपने स्मार्टफोन (startup) की स्क्रीन थोड़ा तिरछा कर लेती हैं। दक्षिण भारत (South India) के एक राज्य कर्नाटक (Karnataka) के अलहल्ली गांव (Alhalli Village) में सुबह का वक्त है लेकिन गर्मी और उमस बहुत है। स्क्रॉल करने के साथ ही चंद्रिका एक के बाद एक कई ऑडियो क्लिप पर क्लिक करती हैं। यह उस ऐप की आसानी को प्रदर्शित करता है जिसका उन्होंने हाल ही में उपयोग करना शुरू किया है। हर टैप पर फोन से उन्हें मातृभाषा (mother language) में अपनी आवाज सुनाई देती है।

इस ऐप का इस्तेमाल शुरू करने से पहले, 30 वर्षीया चंद्रिका (अन्य दक्षिण भारतीयों की तरह, अपने पिता के नाम के पहले अक्षर के. का उपयोग करती हैं, लास्ट नेम के बजाय) के बैंक खाते (bank accounts)  में पहले केवल 184 रुपए (2.25 Dollar) थे।  अप्रेल के आखिर में उन्होंने कई दिनों तक लगभग छह घंटे काम किया। उन्हें 2,570 रुपए (31.30 Dollar) की आय हुई। दूर के स्कूल में शिक्षिका के रूप में काम करने के दौरान वह लगभग उतनी ही राशि कमाती थीं, जितनी उन्हें वहां जाने और वापस आने में लगने वाले बस के किराए के बाद बचती थी। आनेजाने में उन्हें तीन बस बदलनी पड़ती थी। अब अपने काम के भुगतान के लिए उन्हें महीने के अंत तक इंतजार नहीं करना पड़ता। कुछ ही घंटों में पैसा उनके बैंक खाते में जाता है। केवल अपनी मातृभाषा कन्नड़, जो लगभग 60 मिलियन लोगों द्वारा बोली जाती है, ज्यादातर मध्य और दक्षिणी भारत में, भाषा के पाठ को जोर से पढ़कर, चंद्रिका ने इस ऐप का उपयोग करते हुए प्रतिघंटे लगभग 5 डॉलर का वेतन अर्जित किया है, जो भारतीयों की न्यूनतम आय से लगभग 20 गुना ज्यादा है। और कुछ ही दिनों में 50 फीसद बोनस के रूप में उनके खाते में और पैसा जाएगा। एक बार आवाज को सिर्फ वायस क्लिप से मिलाने की जरूरत है।

चंद्रिका की आवाज उन्हें इतनी राशि दिला सकती है? यह सम्भव हुआ है आर्टिफिशियल इंटेलिजेंस (एआई) में आए उछाल की वजह से। फिलहाल, अत्याधुनिक एआईउदाहरण के लिए चैटजीपीटी अंग्रेजी जैसी भाषाओं में सबसे अच्छा काम कर रहे हैं, जहां टेक्स्ट और ऑडियो डेटा प्रचुर मात्रा में ऑनलाइन उपलब्ध हैं। चैटजीपीटी, कन्नड़ जैसी भाषाओं में बहुत अच्छा नहीं कर पा रहा है क्योंकियह भाषा (Language)  लाखों लोगों द्वारा बोले जाने के बावजूद इंटरनेट पर दुर्लभ है। (उदाहरणविकिपीडिया पर अंग्रेजी में 6 मिलियन लेख हैं, जबकि कन्नड़ में सिर्फ 30,000) तो क्या एआई  कम संसाधन वालीभाषाओं के लिए पक्षपाती हो सकते हैं?उदाहरण के लिए, एआई का हमेशा यह मानकर चलना कि डॉक्टर (Doctors)  पुरुष (men )  ही होते हैं और महिलाएं (women)  नर्स (Nurse)। इससे भी समस्या गहरा सकती है। अंग्रेजी भाषा बोलने वाले एआई बनाने के लिए, केवल डेटा एकत्र करना ही पर्याप्त है। डेटा तो पहले से ही बड़ी संख्या में जमा है लेकिन कन्नड़ जैसी भाषाओं के लिए आपको बाहर निकल कर बहुत कुछ तलाशना होगा।

एआई ने दुनिया के कुछ सबसे गरीब लोगों द्वारा बोली जाने वाली भाषाओं के डेटासेटटेक्स्ट या वॉयस डेटा के संग्रहकी भारी मांग उत्पन्न की है। ऐसी मांग उन तकनीकी कंपनियों द्वारा की जाती है जो अपने एआई उपकरण बनाना चाहती हैं। शिक्षा जगत और सरकारों की ओर से भी बड़ी मांग होती है खासकर भारत में, जहां 22 आधिकारिक भाषाओं और कम से कम 780 से अधिक स्वदेशी भाषाओं वाले लगभग 1.4 अरब लोगों के देश में अंग्रेजी और हिन्दी को लंबे समय से प्राथमिकता दी गई है। बढ़ती हुई मांग का मतलब हैकरोड़ों भारतीयोंका अचानक से एक दुर्लभ और नवमूल्यवान संपत्ति के मालिक होना। वह मूल्यवान सम्पत्ति है उनकी मातृभाषा।

एआई को केन्द्रित करते हुए डेटा उत्पन्न करना या रिफाइन करना, भारत के लिए कोई नया काम भी नहीं है। 20वीं सदी के अंत में जिस अर्थव्यवस्था ने कॉल सेंटरों और कपड़ा कारखानों को उत्पादकता इंजन में बदलने के लिए बहुत कुछ किया, 21वीं सदी में चुपचाप डेटा वर्क के साथ वही किया जा रहा है।इंडस्ट्री में एक बार फिर श्रम मध्यस्थता आधारित कंपनियों, जिसका अर्थ है आउटसोर्सिंग, का प्रभुत्व है। ये कंपनियांन्यूनतम के करीब ही वेतन का भुगतान करती हैं, जबकि भारी शुल्क वसूलने के लिए डेटा विदेशी ग्राहकों को बेचती हैं। वर्ष 2022 में डेटा सेक्टर का वैश्विक मूल्य लगभग 2 बिलियन डॉलर से ज्यादा था जिसके 2030 तक बढ़कर 17 बिलियन डॉलर हो जाने का अनुमान है। इस धन का बहुत कम हिस्सा ही भारत, केन्या और फिलीपींस के डेटा वर्कर्स को मिला है। 

ये स्थितियां व्यक्तिगत रूप से काम कर रहे श्रमिकों की जिन्दगी को कहीं अधिक नुकसान पहुंचा सकती हैं। ऑक्सफोर्ड यूनिवर्सिटी के इंटरनेट इंस्टीट्यूट में डिजिटल वर्क प्लेटफॉर्म के विशेषज्ञ जोनास वैलेंटे कहते हैं-‘हम उस व्यवस्था के बारे में चर्चा कर रहे हैं जो हमारे पूरे समाज को प्रभावित कर रही है और वर्कर्स उन व्यवस्थाओं को विश्वसनीय और कम पक्षपाती बनाते हैं।वह आगे कहते हैं-‘अगर आपके पास मूलभूत अधिकारोंकी जानकारी रखने वाले कर्मचारी हैंऔर ज्यादा सशक्त भी, तो मेरा मानना है कि तकनीकि व्यवस्था के जरिए जो परिणाम आएंगे, उनका गुणवत्ता बेहतर होगी। 

अलहल्ली और चिलुकावाड़ी के निकटवर्ती गांवों में, एक भारतीय स्टार्टअप नए मॉडल का परीक्षण कर रहा है। चंद्रिका, ‘कार्याके लिए काम करती हैं।कार्याएक गैरलाभकारी संस्था है जिसे 2021 में बेंगलुरु (पूर्व नाम बैंगलोर) में लॉंच किया गया था जो खुद कोदुनिया की पहली एथिकल डेटा कंपनीके रूप में पेश करती है। अपने अन्य प्रतिद्वंद्वियों की तरह, यह भी बाजार दर पर बड़ी तकनीकि कंपनियों और अन्य ग्राहकों को डेटा बेचती है। अपनी लागत को कवर करती है लेकिन उस रकम का अधिकांश हिस्सा लाभ के रूप में अपने पास रखने के बजायशेष राशि भारत के ग्रामीण इलाकों के गरीबों को भेज देती है। (कार्या ने स्थानीय गैर सरकारी संगठनों के साथ साझेदारी की है ताकि यह सुनिश्चित किया जा सके कि उसकी नौकरियों तक पहुंच सबसे गरीब लोगों के साथसाथ हाशिए पर रहने वाले समुदायों की हो।) अपने वर्कर्स को प्रतिघंटे न्यूनतम 5 डॉलर देने वालाकार्याश्रमिकों को उनके द्वारा बनाए गए डेटा का वास्तविक स्वामित्व भी देता है। जब श्रमिक इसे फिर बेचते हैं तो श्रमिकों को उनके पिछले वेतन के अलावा आय भी हासिल होती है। यह एक ऐसा मॉडल है जो इंडस्ट्री में कहीं अन्य जगह नहीं है।

कार्याजो काम कर रही है, उसका मतलब यह भी है कि लाखों लोग जिनकी भाषाएं ऑनलाइन हाशिए पर हैं, एआई सहित प्रौद्योगिकी के लाभों तक बेहतर पहुंच हासिल कर सकती हैं। 23 वर्षीय छात्रा विनुथा, जिसने मातापिता पर अपनी वित्तीय निर्भरता कम करने के लिएकार्यामें काम किया है, कहती हैं– ‘गांवों में ज्यादातर लोगों को अंग्रेजी नहीं आती। यदि कम्प्यूटर कन्नड़ समझ सकता तो यह बड़ा फायदेमंद होगा।

कार्या के 27 वर्षीय सीईओ मनु चोपड़ा कहते हैं-‘अभी जो वेतन दिया जा रहा है, वह बाजार की विफलता है।वह आगे कहते हैं-‘हमने  कार्या को गैरलाभकारी संस्था बनाने का  फैसला  इसलिए किया क्योंकि मौलिक रूप से आप बाजार में बाजार की विफलता का समाधान नहीं कर सकते।आप इसे इस तरह भी कह सकते हैं कि काम तो पूरक है। कार्या  अपने कर्मचारियों से पहली बात जो कहता है, वह यह हैः यह कोई स्थायी नौकरी नहीं है, बल्कि यह जल्दी से आय बढ़ाने का एक तरीका है जो आपको आगे बढ़ने और अन्य काम करने की अनुमति देगा। ऐप के जरिए एक कर्मचारी अधिकतम 1,500 डॉलर की आय अर्जित कर सकता है जो भारत में औसत वार्षिक आय है। उस बिंदु के बाद, वर्कर्स किसी और के लिए रास्ता बनाते हैं।

कार्या का कहना है कि उसने देश भर में लगभग 30,000 ग्रामीण भारतीयों को मजदूरी के रूप में 65 मिलियन रुपए (लगभग 8,00,000 डॉलर) का भुगतान किया है। चोपड़ा चाहते हैं कि कार्या की पहुंच 2030 तक 100 मिलियन लोगों तक हो। गरीबी में जन्मे और स्टैनफोर्ड में छात्रवृत्ति हासिल करने वाले चोपड़ा कहते हैं– ‘मुझे वास्तव में लगता है कि अगर सही तरीके से काम किया जाए तो लाखों लोगों को गरीबी से बाहर निकालने का यह सबसे गतिशील और अच्छा तरीका है।वह कहते हैं कि निश्चित रूप से यह सामाजिक परियोजना है। वेल्थ इज पावर। हम उन समुदायों को धन का पुनर्वितरण करना चाहते हैं जो पीछे छूट गए हैं।

ऐसा भी नहीं है कि चोपड़ा एआई डेटा वर्क की क्षमता के बारे में बात करने वाले ऐसे पहले तकनीकि संस्थापक हों, जिन्होंने दुनिया के निम्नतम गरीबों को लाभ पहुंचाने का बीड़ा उठाया है। सामाएक आउटसोर्सिंग कंपनी, जिसने ओपनएआई के चैटजीपीटी और मेटा के फेसबुक की हैंडलिंग के लिए कार्य अनुबंध किए हैं, ने ग्लोबल साउथ में लोगों को गरीबी से निजात दिलाने के लिए तकनीकी कंपनियों कोनैतिकतरीके से प्रोत्साहित किया है। लेकिन जैसाकि मैंने जनवरी में खबर दी थी कि केन्या में चैटजीपीटी के कई कर्मचारियोंजिनमें से कुछ 2 डॉलर प्रतिघंटे से भी कम कमाते थेने मुझे बताया कि उन्हें ट्रेनिंग डेटा के सम्पर्क में लाया गया जिससे उन्हें आघात पहुंचा। कंपनी ने फेसबुक के लिए भी इसी तरह का कंटेंट मॉडरेशन कार्य किया; उस परियोजना के एक कर्मचारी ने मुझे बताया कि जब उसने बेहतर कामकाजी परिस्थितियों के लिए अभियान चलाया तो उसे निकाल दिया गया। बीबीसी ने वर्ष 2018 में जब कम वेतन के बारे में पूछा तो सामा के दिवंगत संस्थापक ने तर्क दिया था कि श्रमिकों को अधिक वेतन देने से स्थानीय अर्थव्यवस्थाएं बाधित हो सकती हैं, जिससे लाभ की तुलना में नुकसान अधिक हो सकता है। पिछले 18 महीनों में मैंने इस इंडस्ट्री पर रिपोर्टिंग की है। इस दौरान मैंने जिन डेटा कर्मियों से बात की है, उनमें से कई ने इस तर्क पर जोर देते हुए कहा कि यह उन कंपनियों के लिए सुविधाजनक आख्यान है जो अपने श्रमिकों की आय से अमीर हो रही हैं।

चैटजीपीटी पर मेरे जनवरी के लेख के जवाब में ट्वीट्स की एक श्रृंखला में चोपड़ा ने लिखा था-‘पिछले 5 वर्षों में मैंने सबसे बड़ा जो सबक सीखा है, वह यह है कि सब कुछ संभव है। यह कोई सपना नहीं है जिसमें हम किसी काल्पनिक और बेहतर दुनिया को देख रहे हैं। हम अपने श्रमिकों को न्यूनतम वेतन से 20 गुना अधिक भुगतान कर सकते हैं और फिर भी एक टिकाऊ संगठन बने रह सकते हैं।

यह पहला मौका था जब मैंने कार्या के बारे में सुना और मेरी तत्काल और सहज प्रवृत्ति संदेहभरी थी। सामा ने भी अपना जीवन गरीबी उन्मूलन पर केंद्रित एक गैरलाभकारी संस्था के रूप में शुरू किया था, लेकिन बाद में वह एक लाभकारी व्यवसाय में बदल गया। क्या कार्या एआई उद्योग के लिए वास्तव में और अधिक समावेशी और नैतिक मॉडल हो सकता है? अगर ऐसा है तो इसका पैमाना क्या हो सकता है? एक चीज तो स्पष्ट हैः जमीनी स्तर पर बेहतर परीक्षण के कुछ आधार हो सकते हैंएक ऐसा देश जहां मोबाइल डेटा दुनिया में सबसे सस्ता है और जहां गरीब ग्रामीणों की भी स्मार्टफोन और बैंक खाता दोनों तक पहुंच आम है। एआई से और भी सम्भावित लाभ हो सकते हैं। विश्व बैंक के अनुसार कोविड महामारी से पहले भी भारत में लगभग 140 करोड़ लोग रोजाना 2.15 डॉलर से कम पर जीवनयापन करते थे। उन लोगों के लिए, चोपड़ा जिस वित्तीय स्थिरता की बात कर रहे हैं, वह जीवन बदलने वाला हो सकता है।

बेंगलुरु से सिर्फ 70 किमी की दूरी पर एक गांव हैचिलुकावडी। यह गांव प्रौद्योगिकी के महानगरीय कोलाहल से दूर गन्ने के खेतों के पीछे और खिले हुए गुलमोहर पेड़ों से आच्छादित है। कंक्रीट से बनी एक इमारत में, एक स्थानीय कृषि सहकारी समिति का मुख्यालय है। यहां लगभग दर्जनभर स्त्रीपुरुष एकत्रित हैं जिन्होंने हफ्तेभर पहले ही कार्या के लिए काम करना शुरू किया है। इन्हीं लोगों में से एक हैं 21 वर्षीय दुबलेपतले कनकराज एस., जो ठंडे फर्श पर पालथी मारकर बैठे हैं। वह पास के एक कॉलेज में पढ़ते हैं और पढ़ाई एवं आनेजाने में लगने वाले किराए का खर्च निकालने के लिए कभीकभी आसपास के खेतों में दिहाड़ी मजदूर के रूप में काम कर लेते हैं। एक दिनकाम करने के बदले में वे 350 रुपए (लगभग 4 डॉलर) कमा लेते हैं लेकिन ऐसी मेहनत उनके लिए असहनीय होती जा रही है क्योंकि गर्मी सामान्य से भी बहुत ज्यादा है। पास के शहर में एक कारखाने में काम करने पर उन्हे पैसे तो जरूर ज्यादा मिल जाएंगे लेकिन यह आय बहुत बड़ी कीमत लिए है। रोजाना आनेजाने में बसों में लगने वाला घंटों का वक्त, बस का किराया, अविश्वसनीय रूप से शारीरिक परेशानी, और सबसे बदतर तो यह कि अगर वे शहर में कमरा लेकर कहीं रहते हैं तो वे अपने नेटवर्क से दूर होते जाएंगे। मित्रों से मिलना भी दूर की कौड़ी रह जाएगा।    

कार्या में, कनकराज एक घंटे में उससे ज्यादा कमा सकते हैं जितना वह खेतों में पूरा एक दिन काम करने के बाद कमा पाते। वह कहते हैं-“काम तो अच्छा है और आसान भी।इस मुद्दे पर चोपड़ा का कहना है कि जब वह आम लोगों से मिलते हैं तो लोग अक्सर और हमेशा ही ऐसी प्रशंसाभरी बात कहते हैं। वह कहते हैं– ‘लोग खुश हैं कि हम उन्हें अच्छा वेतन देते हैं।लेकिन ज्यादा महत्वपूर्ण तो यह है कियह मुश्किलभरा और मेहनत वाला काम नहीं है। यह शारीरिक काम नहीं है।कनकराज को उस वक्त आश्चर्यमिश्रित खुशी हुई जब उनके बैंक खाते में भुगतान पहली बार आया। चोपड़ा कहते हैं कि कनकराज ने उन्हें बताया है-‘इसके पहले घोटालों में उसका ढेर सारा धन लुट गया था।उसने यह भी कहा कि ग्रामीणों को अक्सर ही उनके मोबाइल पर एसएमएस आते हैं कि यदि वे उनके यहां धन जमा करें तो वापसी में दस गुना से भी ज्यादाधन लौटाया जाएगा। जब किसी ने उन्हें पहली बार कार्या के कामकाज के बारे में बताया तो उसकी भी प्रारम्भिक प्रतिक्रिया कुछ ऐसी ही थी। 

लोगों की बचत बहुत कम है। स्थानीय लोग इमर्जेंसी जरूरतों के लिए कर्ज लेते हैं। लुटेरी एजेंसियां इन कर्जों पर ऊंची ब्याज दरें वसूलती हैं जिससे यहां के कुछ ग्रामीण कर्ज के चक्र में फंस जाते हैं। उदाहरण के लिए, चंद्रिका को कार्या से जब अपने काम के पैसे मिलेंगे तो वह इस राशि में से कुछ का उपयोग अपने परिवार के कर्ज की भरपाई के लिए करेगी। जब उसकी बहन बीमार हो गई थी तब चंद्रिका के परिवार ने इलाज के लिए  बड़ा कर्ज लिया था। इलाज के बावजूद, उसकी बहन को बचाया नहीं जा सका। परिवार पर एक शिशु और कर्ज का पहाड़ दोनों का बोझ गया। चंद्रिका रोते हुए कहती है कि उसे यह समझ में नहीं रहा था कि कर्ज को कैसे चुकाया जाएगा। हम अपनी बहन को तो वापस नहीं ला सकते थे। कार्य के अन्य वर्कर्स की भी कमोवेश यही स्थिति है। 25 वर्षीय अजय कुमार भी कर्ज मे डूबे हैं। उनकी मां को पीठ में चोट लग गई थी। मां के इलाज के लिए उन्होंने कर्ज लिया था। ऐसे ही एक हैं 38 वर्षीय शिवन्ना एन. उनका बचपन में ही पटाखे की एक फैक्ट्री में हुई दुर्घटना में हाथ चला गया था। उन पर कोई कर्ज तो नहीं है लेकिन उनकी दिव्यांगता का मतलब हैआजीवन अपने जीवनयापन के लिए संघर्ष करना।  

ये ग्रामीण जो काम कर रहे हैं, वह नई परियोजना का हिस्सा है जिसे कार्या स्वास्थ्य सेवा क्षेत्र के एनजीओ के साथ कर्नाटक राज्य में शुरू कर रहा है। टीबी को लेकर स्पीच डेटा (आवाज का डेटा संग्रह करने की प्रक्रिया) का संग्रह किया जा रहा है। टीबी इलाज योग्य और रोकथाम योग्य बीमारी है। इस बीमारी से अभी भी हर साल लगभग दो लाख भारतीयों की जान चली जाती है। आवाज की रिकॉर्डिंग कन्नड़ भाषा की दस अलगअलग बोलियों में की जा रही है जिससे एआई स्पीच मॉडल के लिए प्रशिक्षित किया जाएगा। टीबी के बारे में एआई  स्थानीय लोगों के सवालों, उनकी समस्याओं को समझेगा और जवाब भी देगा जिससे बीमारी के फैलने का खतरा कम हो सकेगा। उम्मीद यही है कि यह ऐप जब तैयार हो जाएगा, अशिक्षित लोगों को विश्वसनीय जानकारी देने में सक्षम होगा, जानकारी तक पहुंच को आसान बनाएगा। टीबी के मरीज को भी इस कलंक से निपटने में  आसानी मिलेगी। यह रिकॉर्डिंग कन्नड़ डेटासेट के हिस्से के रूप में कार्या के प्लेटफॉर्म पर बिक्री के लिए भी जाएगी। एआई कम्पनियां इससे फायदा उठा सकेंगी। हर बार जब इसे दोबारा बेचा जाएगा तो 100 फीसद राजस्व उन कार्या कार्यकर्ताओं में बांटा जाएगा जिन्होंने डेटासेट में योगदान दिया था। राशि का वितरण इस काम में उनके द्वारा खर्च किए गए घंटों के अनुसार किया जाएगा।

ऐसी ही एक महिला हैं 30 वर्षीया राजम्मा एम, जो पास के ही गांव में रहती हैं। वह कोविड-19 में सरकार की तरफ से सर्वेयर का काम करती थीं। घरघर जाकर वह आंकड़े जुटाती थीं कि किसे टीका लगा है और किसे नहीं। लेकिन यह काम जनवरी में खत्म हो गया। अब वह कार्या के लिए काम करती है और उन्हें आय होती है। वह काम मिलने के लिए कार्या की एहसानमंद तो हैं ही, साथ ही वह इस बात की भी प्रशंसा करती हैं कि उन्हें सीखने को बहुत कुछ मिला। वह कहती हैं-‘इस काम ने मुझे टीबी के बारे में, लोगों को इसकी दवा कैसे लेनी चाहिए, कैसे बचना चाहिए, के संदर्भ में बहुत ज्यादा जानकारी और जागरूकता दी है। भविष्य में यह अनुभव मेरी नौकरी में सहायक होगा।

कार्या हालंकि छोटी सी इकाई है। फिर भी पहले से ही माइक्रोसॉफ्ट, एमआईटी और स्टैनफोर्ड समेत कई हाईप्रोफाइल कंपनियां उसकी क्लाइंट हैं और कार्या की सूची में हैं। फरवरी में, इसने बिल और मेलिंडा गेट्स फाउंडेशन के लिए एक नई परियोजना पर काम शुरू किया है। लगभग एक अरब भारतीयों द्वारा बोली जाने वाली पांच भाषाओंमराठी, तेलुगु, हिंदी, बंगाली और मलयालम में वॉयस डेटासेट बनाने का लक्ष्य है। यह परियोजना उसी का हिस्सा है। अंतिम लक्ष्य एक चैटबॉट बनाना है जो स्वास्थ्य देखभाल, कृषि, स्वच्छता, बैंकिंग और कैरियर विकास के बारे में ग्रामीण भारतीयों के सवालों का उनकी मूल भाषाओं और बोलियों में जवाब दे सके। यह प्रौद्योगिकी (इसे गरीबी उन्मूलन के लिए चैटजीपीटी के रूप में सोचें) जीवन की गुणवत्ता में सुधार के लिए उपमहाद्वीप के विशाल क्षेत्र में आवश्यक जानकारी साझा करने में मदद कर सकती है।

माइक्रोसॉफ्ट रिसर्च की भाषाविद् और प्रमुख शोधकर्ता कालिका बाली कहती हैं कि, ‘मुझे लगता है कि एक ऐसी दुनिया होनी चाहिए जहां भाषा प्रौद्योगिकी के लिए कोई बाधा बने ताकि हर कोई प्रौद्योगिकी का उपयोग कर सके, चाहे वह कोई भी भाषा, बोली बोलता हो।कालिका बाली परियोजना पर गेट्स फाउंडेशन के साथ काम कर रही हैं तथा  परियोजना और कार्या के निरीक्षण बोर्ड की अवैतनिक सदस्य हैं। उन्होंने विशेष रूप से लिंग पूर्वाग्रह को कम करने पर काम किया है। उन्होंने श्रमिकों को जोर से पढ़ने के लिए दिए जाने वाले संकेतों को डिजाइन किया है। उनका काम सिर्फ संकेतों के बारे में ही नहीं है। बाली कहती हैंकार्या का ज्यादा वेतनडेटा की गुणवत्ता को बढ़ाने में बड़ा सहायक है। इससे सिस्टम के आउटपुट की बेहतर सटीकता तुरंत मिल  सकेगी।वह आगे यह भी कहती हैं आमतौर पर उन्हें कार्या से जो डेटा मिलता है, उसमें एक फीसद से भी कम गलती होती है। जिस डेटा के साथ हम एआई का मॉडल बनाते हैं, उसके मामले में ऐसा लगभग कभी नहीं होता है।

मैं और चोपड़ा कई दिनों तक एकसाथ रहे। इस दौरान चोपड़ा ने मेरे साथ अपनी जिन्दगी के कुछ अंतरंग क्षण साझा किए। चौपड़ा ने ऐसा ही एक वाक्या सुनाया जो कार्या से उनके जुड़ाव को आत्मसात करता है। उनका जन्म 1996 में दिल्ली में रेलवे लाइन के बगल की एक बस्ती में हुआ था। उनके दादादादी 1947 में भारत के विभाजन के दौरान पाकिस्तान से शरणार्थी के रूप में वहां आए थे और परिवार दो पीढ़ियों तक वहीं रह रहा था। वह कहते हैं कि हालांकि, उनके मातापिता सुशिक्षित थे फिर भी कभीकभी उन्हें भोजन जुटाने के लिए संघर्ष करना पड़ता था। उनके पिता ट्रेन के कलपुर्जे बनाने वाली एक छोटी फैक्ट्री चलाते थे। डिनर में उनके खाने में सस्ती दाल नहीं, बल्कि अपेक्षाकृत महंगी मैगी इंस्टेंट रेमन होती थी। पर, हर मानसून में बस्ती में गंदा पानी भर जाता था और उनका परिवार कुछ दिनों के लिए पास में ही स्थित दादी के घर चला जाता था। कार्या टीम के बारे में चोपड़ा कहते हैं कि मैं सोचता हूं कि हम सभी इस विचार से प्रेरित हैं कि धन सहारा है जो एक सच्चाई है। हमारा लक्ष्य यथासंभव अधिक से अधिक लोगों को वह सहायता प्रदान करना है।

चोपड़ा ने अपनी बस्ती के स्कूल में उत्कृष्ट प्रदर्शन किया है। यह स्कूल एक एनजीओ चलाता था। जब वह नौंवी कक्षा में थे, उन्हें दिल्ली के एक निजी स्कूल से छात्रवृत्ति मिली। गरीब पृष्ठभूमि के बच्चों को स्कूल में दाखिला देने के लिए प्रतियोगिता हुई थी जिसमें उन्हें सफलता मिली। हालांकि, उन्हें तंग किया गया। वह स्वीकार करते हैं कि कुछ विशेषाधिकारों ने उनके लिए दरवाजे खोलने में मदद की। वह कहते हैं-‘मेरी जिन्दगी जितनी कठिन थी, भारत में अधिकांश लोगों की तुलना में वह काफी आसान थी क्योंकि मेरा जन्म एक बड़े शहर में, दो शिक्षित मातापिता के घर और उच्चजाति के परिवार में हुआ था।  चोपड़ा जब 17 वर्ष के थे, दिल्ली में एक बस में एक महिला के साथ घृणतापूर्ण तरीके से दुष्कर्म किया गया था।

यह एक ऐसा अपराध था जिसने भारत और दुनिया को झकझोर कर रख दिया। चोपड़ा का उस समय कंप्यूटर साइंस के प्रति लगाव बढ़ गया था और वे स्टीव जॉब्स को अपना आदर्श मानते थे। उन्होंने हाथ की घड़ी के स्टाइल मेंछेड़छाड़रोधी उपकरण  बनाया जो बढ़ी हुई हृदयगति का पता लगा सकता था और हमलावर को धीमा बिजली का झटका दे सकता थाताकि पीड़ित को भाग निकलने का समय मिल सके। इस डिवाइस ने मीडिया का ध्यान खींचा और भारत के पूर्व राष्ट्रपति डॉ. .पी.जे. अब्दुल कलाम ने चोपड़ा को स्टैनफोर्ड में छात्रवृत्ति के लिए आवेदन करने के लिए प्रोत्साहित किया। (चोपड़ा याद करते हुए कहते हैं कि उन्हें स्टेनफोर्ड के बारे में केवल एक बात ही पता थी कि स्टीव जॉब्स ने वहां पढ़ाई की है। बाद में उन्हें पता चला कि उनकी जानकारी सच नहीं थी) बाद में, चोपड़ा को गैजेट के जरिए यौन हिंसा की समस्या हल करने की कोशिश की नादानी का एहसास हुआ। वह कहते हैं कि प्रौद्योगिकीविदों में किसी समस्या को देखने और उसे हल करने की प्रवृत्ति बहुत अधिक होती है। 11वीं कक्षा के बच्चे की आलोचना करना कठिन है, लेकिन यह बहुत ही तकनीकी समाधान था।

जैसाकि वह बताते हैं कि कैलिफोर्निया में उनका आना कई मायनों में एक सांस्कृतिक झटका था। चोपड़ा कहते हैंपहली रात को ही उनके छात्रावास में हर छात्र ने यही बताया कि वह अपना पहलाअरब डॉलर कैसे कमाएगा। किसी नेपिल्लों (कुत्ते के बच्चों) के लिए स्नैपचैटबनाने का सुझाव दिया। उन्हें एहसास हुआ कि यहां तो हर किसी की योजना अरबपति बनने की है, सिवाय उनके। चोपड़ा आगे कहते हैं कि स्टैनफोर्ड में बहुत पहले, उन्हें अकेलापन महसूस होता था, जैसे गलत जगह पर गए हों। फिर भी वह कॉलेज मेंटेक्नोयूटोपियनके रूप में आए थे।  धीरेधीरे उनका अकेलापन दूर होता गया क्योंकि उन्होंने कक्षा में सीखा कि आईबीएम ने कैसे दक्षिण अफ्रीका में अपना श्रमबल बढ़ाने के लिए व्यवस्था बनाई और प्रौद्योगिकी कंपनियों ने कैसे खुद ही लाभ कमाने के लिए दुनिया को नुकसान पहुंचाया।

भारत लौटने के बाद, चोपड़ा माइक्रोसॉफ्ट रिसर्च, जो बिग टैक कंपनी की सहायक कंपनी है, में शामिल हो गए। यह कंपनी मुश्किलभरी सामाजिक समस्याओं पर काम करने के लिए शोधकर्ताओं को बहुत छूट देती है। अपने सहयोगी विवेक शेषाद्रि के साथ, उन्होंने इस मुद्दे पर शोध करना शुरू किया कि क्या डिजिटल का उपयोग करके ग्रामीण भारतीयों तक पैसा पहुंचाना संभव हो सकेगा। चोपड़ा की पहली फील्ड विजिट मुंबई में एक एआई डेटा कंपनी द्वारा संचालित केंद्र की हुई। वह याद करते हुए कहते हैं कि कमरा गंदा, बहुत ही गरम था और लोगों से भरा हुआ था। इमेज एनोटेशन पर काम करने वाले लोग लैपटॉप पर झुके हुए थे। जब उन्होंने इन लोगों से पूछा कि वे कितना कमा लेते हैं, उनका जबाव था 30 रुपए यानी 0.40 डॉलर प्रतिघंटा। उन्हें यह बताने का साहस नहीं था कि जिस डेटा को वे एनोटेट कर रहे थे, उसकी दर, परंपरागत रूप से, उस राशि से 10 गुना है। वह कहते हैं कि मैंने सोचा, काम करने का यह एकमात्र तरीका नहीं हो सकता।

चोपड़ा और शेषाद्रि ने माइक्रोसॉफ्ट रिसर्च में चार वर्ष तक इस विचार पर काम किया, फील्डस्टडी की और एक प्रोटोटाइप ऐप बनाया। 2019 में चार सहयोगियों के साथ उन्होंने एक रिसर्च प्रकाशित की। भारत के गांवों में रहने वाले गरीबों के बीच काम करने की उत्साह से भरी यह रिसर्च थी। रिसर्च से चोपड़ा और शेषाद्रि के इस गुमान की पुष्टि हुई कि काम को बिना किसी प्रशिक्षण, कार्यालय के बजाए सिर्फ स्मार्टफोन से, अंग्रेजी जानने वाले कार्यकर्ताओं के जरिए उच्च मानकों की सटीकता के साथ किया जा सकता है। इस प्रकार केवल शहर के लोगों तक बल्कि ग्रामीण भारत के सबसे गरीब लोगों तक भी पहुंचना संभव हो गया। 2021 में चोपड़ा और शेषाद्रि ने, माइक्रोसॉफ्ट रिसर्च से अपनी नौकरी छोड़ दी और कार्या को एक स्वतंत्र गैरलाभकारी संस्था के रूप में स्थापित किया। इसमें तीसरे सहसंस्थापक सफिया हुसैन भी शामिल हुए हैं। (माइक्रोसॉफ्ट की कार्या में कोई इक्विटी नहीं है।)

सिलिकॉन वैली के गरीबों से अमीर बनने की कई कहानियों के विपरीत, चोपड़ा कहते हैं कि उनकी सफलता उनके खुद की कड़ी मेहनता का परिणाम नहीं है। वह कहते हैं– ‘मैं लगातार 100 बार भाग्यशाली रहा। मैं गैरलाभकारी संस्थाओं, स्कूलों, सरकार की अतार्किक करुणा का उत्पाद हूंजिनसे हर किसी की मदद करने की अपेक्षा की जाती है, लेकिन वे ऐसा करते नहीं है। जब मुझे इतनी दया मिली है तो मैं कम से कम इतना तो कर ही सकता हूं कि उसे वापस लौटा दूं।

हर कोई कार्या में काम करने के लिए उपयुक्त नहीं है। चोपड़ा कहते हैं कि शुरुआत में उन्होंने और उनकी टीम ने हर किसी के लिए ऐप को  खोला। पर सामने आया कि पहले सौ साइनअप करने वाले सभी लोग एक ही प्रमुख जातिसमुदाय के पुरुष थे। अनुभव ने उन्हें सिखा दिया है, ‘ज्ञान सत्ता के चैनलों के जरिए बहता है।चोपड़ा को पहले ही पता चल गया था कि उन्हें ग्रामीण क्षेत्रों में जमीनी स्तर पर खुद की मौजूगी के साथ गैरलाभकारी संस्थाओं के साथ मिलकर काम करना होगा। सबसे गरीब समुदायों और हाशिये की जातियों तक पहुंचने के लिए यही रास्ता भी था। यह भी मालुम था कि ये संगठन आय और विविध आवश्यकताओं के अनुरूप कार्या की ओर से एक्सेस कोड वितरित कर सकते हैं। वह कहते हैं कि उन्हें ज्ञात है कि पैसा किसके लिए अच्छा है और किसके लिए यह जीवन बदलने वाला है। यह प्रक्रिया श्रमिकों द्वारा तैयार किए जाने वाले डेटा में ज्यादा विविधता भी सुनिश्चित करती है, जिसकी वजह से एआई पूर्वाग्रह को कम करने में मदद मिल सकती है।

चोपड़ा अपनी इस पद्धति को हिन्दी के एक शब्दठहरावका उपयोग करके परिभाषित करते हैं। भारतीय शास्त्रीय संगीत में उपयोग किए जाने वाला यह एक शब्द है। इसका अनुवाद वहविरामऔरविचारशील प्रभावके मिश्रण के रूप में करते हैं। उनका कहना है कि ठहराव एक अवधारणा है, जो केवल अंग्रेजी भाषा से गायब है, बल्कि सिलिकॉन वैली, तकनीकी कंपनियों के व्यापार दर्शन से भी गायब है, जो अक्सर पैमाने और गति को बाकी सभी चीजों से ऊपर रखती हैं। उनके लिए ठहराव का अर्थ है-‘हर कदम पर आप रुक रहे हैं और सोच रहे हैं: क्या मैं सही काम कर रहा हूं? क्या हमारा काम उस समुदाय के लिए सही है जिसकी मैं सेवा करने का प्रयास कर रहा हूं?’ वह कहते हैं कि इस तरह की विचारशीलता बहुत से उपक्रमों से गायब है। अब नया मंत्र है-‘तेजी से आगे बढ़ो और चीजों को अलग कर दो।उद्यमों के इसी दृष्टिकोण के  कारण कार्या ने कंटेट मॉडरेशन करने के लिए चार ग्राहकों के प्रस्तावों को स्पष्ट रूप से अस्वीकार कर दिया।

यह कथन सम्मोहक है. लेकिन यह कथन एक ऐसे इंसान की तरफ से कहा जा रहा है जिसका कहना है कि वह अपने ऐप को  2030 तक 100 मिलियन भारतीयों तक पहुंचाना चाहता है। क्या जमीनी स्तर के गैर सरकारी संगठनों पर निर्भरता का मतलब यह नहीं है कि कार्या को एक महत्वपूर्ण बाधा का सामना करना पड़ रहा है? दरअसल, चोपड़ा ने मुझसे कहा, कार्या के विस्तार में नए कर्मचारी नहीं तलाश पाना सीमित कारक है। ऐसे लाखों लोग हैं जो उच्च वेतन के अवसर का लाभ उठाएंगे और कार्या ने उन्हें अपने साथ जोड़ने के लिए 200 से अधिक जमीनी स्तर के गैर सरकारी संगठनों का एक जांचापरखा नेटवर्क बनाया है। वह कहते हैं कि हमें बड़े पैमाने पर जागरूकता बढ़ाने की जरूरत है। चोपड़ा का मानना है कि ऐप के प्रभाव के लिए, उन्हें अधिक ग्राहकों के भरोसे की जरूरत है। ज्यादा प्रौद्योगिकी कंपनियों, सरकारों और शैक्षणिक संस्थानों को राजी करना होगा कि वे कार्या से अपना एआई प्रशिक्षण डेटा प्राप्त करें।

लेकिन अक्सर होता यह है कि नैतिकता पर गर्व करने वाली कंपनियां नए ग्राहकों की तलाश के लिए समझौता कर सकती हैं। ऐसा होने देने के लिए कार्या क्या करेगी? अपने जवाब के हिस्से में, चोपड़ा कहते हैं कि इसका जवाब कार्या की कॉर्पोरेट संरचना में निहित है। कार्या अमेरिका में एक गैरलाभकारी संस्था के रूप में पंजीकृत है जो भारत में दो संस्थाओं को नियंत्रित करती है: एक गैरलाभकारी और एक लाभ के लिए। लाभ कमाने वाली संस्था कानूनी रूप से अपने किसी भी लाभ को (कर्मचारियों को प्रतिपूर्ति करने के बाद) गैरलाभकारी संस्था को दान देने के लिए बाध्य है जिससे रीइन्वेस्ट होता है। चोपड़ा कहते हैं, कार्या अनुदान निधि लेता है। यह अपने सभी 24 पूर्णकालिक कर्मचारियों के वेतन को कवर करता है लेकिन आंतरिक रूप से गैरलाभकारी मॉडल संभव होने के लिए पर्याप्त नहीं है। चोपड़ा का कहना है कि इस व्यवस्था से उन्हें या उनके सहसंस्थापकों को आकर्षक अनुबंधों के बदले में श्रमिकों के वेतन या कल्याण से समझौता करने के लिए किसी भी प्रोत्साहन को हटाने का लाभ मिलेगा।

/नज इंस्टीट्यूट की मैनेजिंग पार्टनर सुभाश्री दत्ता, जिन्होंने कार्या को 20 हजार डॉलर के अनुदान के साथ अपना सहयोग दिया है, कहती हैं-‘कार्या बहुत युवा संस्था है। उसके पास अपने मूल्यों के प्रति ईमानदार रहने और फिर भी पूंजी को आकर्षित करने की क्षमता है। मुझे नहीं लगता कि कार्या लाभ के लिए अथवा गैरलाभ के लिए कशमकश की स्थिति में रहेगी।

दक्षिणी कर्नाटक में कार्या कार्यकर्ताओं के साथ दो दिन बिताने के बाद कार्या की मौजूदा व्यवस्था की सीमाएं दिखने लगीं। हर कार्यकर्ता का कहना था कि उन्होंने ऐप पर 1,287 टास्क पूरे कर लिए हैं। मेरे दौरे के समय, टीबी परियोजना पर उपलब्ध कार्यों की संख्या में यह अधिकतम है। श्रमिकों को मिलने वाली राशि एक स्वागत योग्य प्रोत्साहन है, लेकिन लंबे समय तक ऐसा नहीं चलने वाला है। अपनी यात्रा में, मैं ऐसे किसी भी कर्मचारी से नहीं मिला, जिसे रॉयल्टी मिली हो। चोपड़ा ने मुझसे कहा कि कार्या ने खरीदारों के लिए पर्याप्त पुनर्विक्रय योग्य डेटा एकत्र किया है; अब तक लगभग 4,000 श्रमिकों को 1,16,000 डॉलर की रॉयल्टी बांटी गई है।

मैंने चोपड़ा से बातचीत में कहा कि इन ग्रामीणों के जीवन पर सार्थक असर पड़ने में अभी बहुत समय लगेगा? उन्होंने जवाब दिया कि टीबी परियोजना तो अभी इन कामगारों के लिए शुरुआतहै। वे जल्द ही ट्रांसक्रिप्सन टास्क पर काम शुरू करने जा रहे हैं। ट्रांसक्रिप्सन टास्क कन्नड़ सहित कई क्षेत्रीय भाषाओं में एआई मॉडल बनाने के लिए भारत सरकार के प्रयासों का हिस्सा है। उनका कहना है कि इससे कार्या को चिलुकावडी में ग्रामीणों कोबहुत ज्यादाकाम देने की अनुमति मिलेगी। फिर भी कामगार 1,500 डॉलर से बहुत दूर हैं जो कार्या के सिस्टम में है। चोपड़ा ने स्वीकार भी किया कि कार्या के 30,000 कर्मचारियों में से एक भी 1,500 डॉलर की सीमा तक नहीं पहुंचा है। फिर भी काम के प्रति उनका लगाव, काम के प्रति उनकी अधिक इच्छा स्पष्ट है। शेषाद्रि, जो अब कार्या के मुख्य प्रौद्योगिकी अधिकारी हैं, ने जब कामगारों से भरे कमरे में जब उनसे पूछा कि क्या वह कन्नड़ वाक्यों में अशुद्धियों को चिह्नित करने वाले नए कार्य में खुद को सक्षम महसूस करेंगे तो वे उत्साहित हो गए. उन्होंने सर्वसम्मति से हां में जवाब दिया।

मैं चिलुकावाडी और अलहल्ली गांव में जिन लोगों से मिला और बात की तो  लगा कि उनकी ऑर्टिफिशियल इंटेलीजेंस के बारे में समझ सीमित है। चोपड़ा कहते हैं कि श्रमिकों को यह समझाना चुनौतीपूर्ण हो सकता है कि वे क्या कर रहे हैं। उनका कहना है कि उनकी टीम नेसमझाने का जो सबसे सफल तरीका खोजा है, वह है कर्मचारियों को यह बताना कि वेकंप्यूटर को कन्नड़ बोलना सिखा रहे हैं यहां कोई भी चैटजीपीटी के बारे में नहीं जानता, लेकिन गांव वालों को मालुम है कि गूगल असिस्टेंट (जिसे वेओके गूगलकहते हैं) तब बेहतर काम करता है जब आप इससे अपनी मातृभाषा की तुलना में अंग्रेजी में कहते हैं।

तीन बच्चों के 35 वर्षीय बेरोजगार पिता सिद्धाराजू एल. का कहना है कि उन्हें नहीं मालुम कि एआई क्या होता है, लेकिन अगर कंप्यूटर उनकी भाषा बोल सके तो उन्हें गर्व महसूस होगा। मेरे मन में अपने मातापिता के लिए जितना सम्मान है, उतना ही सम्मान अपनी मातृभाषा के लिए भी है।  जिस तरह भारत 4जी मामले में बाकी दुनिया से आगे निकलने में सक्षम था, क्योंकि उस पर मौजूदा मोबाइल डेटा इंफ्रास्ट्रक्चर का बोझ नहीं था। उम्मीद है कि  उसी तरह कार्या की कोशिशों से भारतीय भाषा की एआई परियोजनाओं को सीखने में मदद मिलेगी। कहीं अधिक विश्वसनीय और निष्पक्ष बिंदु से शुरुआत करें। स्पीच शोधकर्ता बाली अपने उच्चारण को संदर्भित करते हुए कहती हैं, ‘कुछ वक्त पहले तक अंग्रेजी के लिए स्पीचपहचान इंजन मेरी अंग्रेजी भी नहीं समझता था।वह यह भी कहती हैं-‘एआई प्रौद्योगिकियों के होने का क्या मतलब, अगर वे उपयोगकर्ताओं की जरूरत पूरा नहीं कर पाएं?’

 (टाइम मैगजीन की कवर स्टोरी से साभार)

 

 

Show comments