सूचना प्रौद्योगिकी और भारतीय भाषाएँ - -विजयकुमार मल्होत्रा का आलेख

सूचना प्रौद्योगिकी और भारतीय भाषाएँ
--विजय कुमार मल्होत्रा

१. सभी भारतीय भाषाओं के लिए समान कुंजीपटल

विविधता में एकता अर्थात Unity in Diversity भारतीय संस्कृति को मूलभूत विशेषता रही है। यही अंतर्निहित समानता ब्राह्मी लिपि से उद्भूत और विकसित सभी भारतीय लिपियों में भी कमोबेश रही हैं। ब्राह्मी लिपि संस्कृत और भारतीय भाषाओं के लिए लगभग ३५० ई.पू. से लेकर ३५० ई. तक केवल भारत में ही नहीं, अन्य अनेक पड़ोसी देशों में भी प्रयुक्त होती थी। यह लिपि अपने युग की सर्वाधिक वैज्ञानिक और आदर्श लिपि थी। यही कारण था कि खरोष्ठी आदि लिपियों के रहते हुए भी बौद्ध तथा जैन धर्म के प्रचारकों ने भी ब्राह्मी लिपि को ही अपने धर्म के प्रचार और ग्रंथों के निर्माण के लिए इस्तेमाल किया। चौथी शताब्दी के उत्तरार्ध में ब्राह्मी लिपि दो शैलियों में भी विभक्त हो गई, उत्तरी और दक्षिणी शैली। उत्तर भारत की सभी लिपियाँ ब्राह्मी की उत्तरी शैली से और दक्षिण भारत की लिपियाँ दक्षिणी शैली से विकसित हुई हैं। कालांतर में इनमें काफ़ी अंतर आ गया। इस अंतर का एक प्रमुख कारण कदाचित लेखन सामग्री की भिन्नता भी रहा है। दक्षिण भारत में ताड़ वृक्षों की बहुलता के कारण लेखन सामग्री के रूप में ताड़पत्रों का प्रयोग किया जाता था। और उस कलम पर सीधे लेखन से ताड़पत्रों के फटने की आशंका रहती थी। इसलिए नोकदार सूखी कलम से वृत्ताकार रूप में लिखने की परंपरा विकसित हुई। इसके विपरीत, उत्तर भारत में चपटी और खोखली कलम से वृत्त के बजाय ऊपर नीचे की मात्राओं के साथ लिखने की परंपरा विकसित हुई।

इतनी विविधताओं और विभिन्नताओं के बावजूद ध्वन्यात्मक स्वरूप होने के कारण इन सभी लिपियों की वर्णमाला के क्रम में विलक्षण समानता है। इसी अंतर्निहित समानता को आधार बनाकर कुछ लिपियों में प्रचलित विशिष्ट ध्वनियों को 'परिवर्धित देवनागरी' के अंतर्गत समाहित कर लिया गया है। इसी मूलभूत समानता को आधार बनाकर वर्ष १९८३ में आई.आई.टी., कानपुर के वैज्ञानिकों ने सभी भारतीय भाषाओं के लिए एक समन्वित देवनागरी टर्मिनल का विकास किया, जिसे वर्ष १९८६ में दिल्ली में आयोजित विश्व हिंदी सम्मेलन में प्रदर्शित किया गया। दो वर्ष के बाद भारत में सुपर कंप्यूटर के लिए इलैक्ट्रॉनिकी विभाग के अंतर्गत पुणे में स्थापित सी-डैक ने इसे 'जिस्ट' (Graphics and Intelligence Script Technology) के रूप में पुष्पित और पल्लवित किया। सभी भारतीय लिपियों में अंतर्निहित समानता के आधार पर 'इस्की' (ISCII Aqaa-t\ Indian Standard code for Information Interchange) कोडिंग प्रणाली का विकास किया गया। कंप्यूटर जगत में अंग्रेज़ी के वर्चस्व को देखते हुए इस प्रणाली में भारतीय लिपियों के साथ-साथ रोमन लिपि को भी समाहित किया गया और इसके लिए 'इन्स्क्रिप्ट' (Indian Script का संक्षिप्त रूप) कुंजीपटल का विकास किया गया। अभी तक सभी भारतीय भाषाओं और लिपियों के लिए यांत्रिक टाइपराइटर के लिए अलग-अलग कुंजीपटल इस्तेमाल किए जाते थे। इतना ही नहीं, सिर्फ़ देवनागरी लिपि के लिए दो-तीन कुंजीपटल आज भी प्रचलन में हैं। ऐसी स्थिति में रोमन, और सभी भारतीय लिपियों (उर्दू को छोड़कर) के लिए एक समन्वित कुंजीपटल (integrated keyboard) के विकास की परिकल्पना भी भारतीय संस्कृति की मूल भावना 'विविधता में एकता' अर्थात 'Unity in Diversity' के ही अनुरूप थी। इसके लिए सभी भारतीय भाषाओं की ५५ मूल ध्वनियों को समान वर्ण या character के रूप में ही 'इस्को' में समाहित किया गया था। 'इस्को' कोडिंग प्रणाली ८ बिट पर आधारित है, जबकि अधिकांश योरोपीय भाषाओं के लिए प्रयुक्त रोमन लिपि के लिए विकसित 'आस्की' (ASCII Aqaa-t\ American Standard Code for Information Interchange) कोडिंग प्रणाली ७ बिट पर आधारित है किंतु 'इस्की' के अंतर्गत इसे भी समाहित किया गया है। सह अस्तित्व (co-existence) की इसी भावना के कारण 'इन्स्क्रिप्ट' कुंजीपटल से भारतीय भाषाओं के साथ-साथ रोमन लिपि में लिखी जाने वाली योरोप की अधिकांश भाषाओं में भी कंप्यूटर पर काम किया जा सकता है। सभी भारतीय लिपियों के लिए समान कोडिंग प्रणाली के कारण उनमें परस्पर लिप्यंतरण (transliteration) की सुविधा भी अनायास ही उपलब्ध हो गई है। साथ ही यह सुविधा रोमन में भी उपलब्ध है, अर्थात भारतीय लिपियों से रोमन में भी लिप्यंतरण किया जा सकता है।

वस्तुत: यह एक ऐतिहासिक संयोग ही है कि कंप्यूटर के लिए आरंभ में रोमन लिपि का उपयोग किया गया, किंतु इसका कोई तकनीकी कारण नहीं हैं। यह तथ्य तो सर्वविदित ही है कि कंप्यूटर का विकास सर्वप्रथम उन देशों में हुआ जिनकी भाषा मुख्यत: रोमन लिपि पर आधारित थी, किंतु आज रोमनेतर लिपियों में भी कंप्यूटर का व्यापक उपयोग किया जाने लगा है। कुछ हद तक यह सही है कि रोमन लिपि रेखिक(linear) होने के कारण यंत्र के लिए अपेक्षाकृत अधिक सुगम है, किंतु "नासा" (NASA) के प्रसिद्ध अमरीकी वैज्ञानिक रिक ब्रिग्ज़ की यह धारणा है कि देवनागरी लिपि में लिखी जाने वाली संस्कृत भाषा कंप्यूटर प्रोग्राम की दृष्टि से आदर्श भाषा है। इसका कारण कदाचित यही है कि यह अत्यंत सूत्रबद्ध (codified) भाषा है।

वस्तुत: आज आवश्यकता इस बात की है कि 'वसुधैव कुटुंबकम्' की भावना से विश्व की सभी भाषाओं और लिपियों को एक ही कोड़िंग प्रणाली के अंतर्गत समाहित किया जाए। रोमन लिपि की सुगमता के कारण आरंभ में विश्व की सभी भाषाओं में कुंजीयन (keying) का कार्य रोमन लिपि के माध्यम से करने के प्रयास किए गए। इस दिशा में अमरीका की ज़ीरोक्स कॉर्पोरेशन द्वारा विकसित 'स्टार' सॉफ्टवेयर अत्यंत लोकप्रिय सिद्ध हुआ। वस्तुत: रोमनेतर लिपियों में इतनी अधिक भिन्नता है कि उन्हें एक कुंजीपटल पर लाना कोई सहज कार्य नहीं है। अरबी और हिब्रू दाएँ से बाएँ लिखी जाती हैं। चीनी लिपि अधिकांशत: ऊपर से नीचे लिखी जाती है। चीनी एक रूपमिक (morphemic) लिपि है। इसमें ६५,५३६ भावचित्र (ideographs) हैं और प्रत्येक भावचित्र का अलग-अलग अर्थ है। ऐसी वैविध्यपूर्ण और विशिष्ट लिपि को 'स्टार' के अंतर्गत १२८४ रोमन अक्षरों में लिप्यंतरित किया गया है। कोरियन लिपि में अनेक अक्षरों का गुच्छा (cluster) बन जाता है। इसे १४४३ रोमन अक्षरों में समाहित किया गया है। जापानी लिपि में भी लगभग ५०,००० भावचित्र हैं। इन्हें जापानी भाषा में 'कंजी' कहा जाता है। इन तमाम भावचित्रों को रोमन के २००० से ३००० अक्षरों में समाहित किया गया है। जहां तक भारतीय भाषाओं का संबंध हैं, भारत में अठारह संविधान सम्मत भाषाएँ हैं और ये भाषाएँ १० अलग-अलग लिपियों में लिखी जाती हैं, किंतु सभी भाषाएँ ध्वन्यात्मक हैं और उर्दू को छोड़कर शेष भाषाओं की वर्णमाला भी एक है।

किंतु वर्ष १९९१ में विश्व की सभी भाषाओं के लिए युनिकोड १.० से संबंधित एक प्रलेख प्रकाशित किया गया, जिसमें इस्की-८८ कोड को भी समाहित किया गया था। बाद में उसी वर्ष के दौरान भारतीय मानक ब्यूरो ने IS १३१९४ : १९९१ के रूप में इस्की-९१ कोडिंग प्रणाली को मानक के रूप में स्वीकार कर लिया। आज विंड़ोज़ २००० के रिलीज़ के बाद युनिकोड प्रणाली विश्वभर में लोकप्रिय हो गई है। वस्तुत: युनिकोड ही एकमात्र ऐसी मानक प्रणाली है, जिसमें विश्व की अधिकांश भाषाओं के शब्दों और अक्षरों को समाहित किया गया है। एक समय था, जब कंप्यूटर ८ बिट प्रणाली पर आधारित होते थे तो एक बाइट (byte) में २५६ तरीकों से ही अक्षरों को व्यक्त किया जा सकता था। अंग्रेज़ी भाषा के २६ अक्षरों के लिए तो यह उपयुक्त थी और भारतीय भाषाओं की ५५ मूल ध्वनियों को भी इसके अंतर्गत समाहित किया जा सकता था, किंतु चीनी, कोरियाई और जापानी जैसी भाषाओं की जटिल लिपियों के लिए यह पर्याप्त नहीं थी। इसलिए १६ बिट प्रणाली के अंतर्गत युनिकोड की परिकल्पना की गई, जिसके अंतर्गत ६५,५३६ अक्षरों को समाहित किया जा सकता था। इसके फलस्वरूप सभी भाषाओं के लिए अलग-अलग परिचालन प्रणाली की आवश्यकता भी नहीं रह गई। इसका दूसरा लाभ यह होगा कि इंटरनेट पर केवल अंग्रेज़ी का वर्चस्व नहीं रहेगा। सहअस्तित्व की भावना के साथ विश्व की सभी भाषाएँ इसमें समाहित हो जाएँगी। चूँकि युनिकोड में रोमन पर आधारित मानक कोडिंग प्रणाली आस्की-७ के २५६ अक्षर भी शामिल हैं, इसलिए ८ बिट पर आधारित कंप्यूटर भी युनिकोड़ के अनुरूप हैं। भारतीय भाषाओं के लिए विकसित 'इस्की-८' को भी युनिकोड में स्थान दिया गया है।

२. विभिन्न परिचलन प्रणालियों में भारतीय भाषाओं की स्थिति

आज 'डॉस', 'विंडोज़' और 'युनिक्स', 'मैक' आदि सभी परिचलन प्रणालियों (Operating Systems) भारतीय भाषाओं में संसाधन की सुविधा मौजूद हैं। इस कार्य में अनेक सरकारी और गै़र-सरकारी संस्थाओं का योगदान रहा है। सरकारी संस्थाओं में भारत के लिए सुपर कंप्यूटर के निर्माता पुणे (महाराष्ट्र) स्थित 'सी-डैक' का योगदान अप्रतिम है। इस संस्था ने भारतीय भाषाओं के लिए सॉफ्टवेयरों की एक पूरी श्रृंखला विकसित की है। 'डॉस' परिवेश के अंतर्गत भारत की अनेक प्रमुख संस्थाओं ने शब्द संसाधन (Word Processing) के अनेक पैकेज विकसित किए। इनमें प्रमुख है - 'एएलपी', 'मल्टीवर्ड', 'शब्दरत्न', 'शब्दमाला', 'अक्षर', 'बाइस्क्रिप्ट', 'सुवर्ड' आदि। किंतु शब्द संसाधन के साथ-साथ डैटा संसाधन (Data Processing) का कार्य हिंदी में करने के लिए सी-डैक ने 'जिस्ट कार्ड', आर.के. कंप्यूटर्स ने 'सुलिपि' और 'सॉफ्टेक' कंपनी ने 'देवबेस' विकास किया। किंतु जहाँ 'सुलिपि' और 'देवबेस' में भारतीय भाषाओं में केवल हिंदी को ही समाहित किया गया है, वहाँ सी-डैक, पुणे द्वारा विकसित 'जिस्ट' कार्ड में भारतीय भाषाओं की सभी लिपियों के साथ-साथ दक्षिण-पूर्वेशिया और योरोप की कुछ लिपियों को भी समाहित किया गया है। फारसी-अरबी पर आधारित उर्दू लिपि भी 'जिस्ट कार्ड' की अन्यतम विशेषता है, किंतु ये सभी सॉफ्टवेयर आईबीएम पीसी के लिए है, मैक (MAC) प्लेटफॉर्म के लिए सी-डैक ने 'एएलपी' शब्द-संसाधन का विशेष वर्शन (version) विकसित किया है।

इसमें संदेह नहीं कि इन सॉफ्टवेयरों के माध्यम से डॉस परिवेश के अंतर्गत सरलता से हिंदी में काम किया जा सकता है, किंतु अभी भी इनके कमांड (command) और मेन्यू (menu) आदि अंग्रेज़ी में ही है। इस कठिनाई को देखते हुए आईबीएम टाटा कंपनी ने आर.के.कंप्यूटर्स की मदद से 'हिंदी डॉस' नाम से एक ऐसी परिचलन प्रणाली (operating system) का विकास किया है, जिसके अंतर्गत 'कमांड' और 'मेन्यू' भी हिंदी में दिए गए हैं और फ़ाइल का नाम भी हिंदी में दिया जा सकता है। यूनिक्स परिवेश के अंतर्गत सी-डैक ने 'जिस्ट टर्मिनल' और आर.के. कंप्यूटर्स ने 'सूयूनिक्स' का विकास किया है। सी-डैक ने यूनिक्स परिवेश के अंतर्गत शब्द संसाधन के लिए एएलपी का यूनिक्स वर्शन (version) भी विकसित किया है, जिसमें स्पैल-चैकर आदि की अधुनातन सुविधाएँ भी मौजूद हैं। किंतु आज आम आदमी के लिए सर्वाधिक मैत्रीपूर्ण प्लेटफॉर्म है 'विंडोज़'। इस प्लेटफार्म पर भारतीय भाषाओं में विभिन्न प्रकार के 'इंटरफेस' विकसित किए गए हैं। इनमें प्रमुख हैं : सी-डैक द्वारा विकसित 'लीप ऑफ़िस' और 'इज़्म ऑफ़िस', आर.के.कंप्यूटर्स द्वारा विकसित 'सुविंडोज़', एसीईएस कंसल्टैंट्स द्वारा विकसित 'आकृति ऑफ़िस' और 'सॉफ्टैक' कंपनी द्वारा विकसित 'अक्षर फॉर विंडोज़' आदि। मैक प्लेटफॉर्म के लिए सी-डैक ने 'मैक इज़्म' का विकास किया है, जिसके माध्यम से 'पेजमेकर'और 'क्वार्क एक्सप्रेस' आदि में भी हिंदी में कार्य किया जा सकता है। इनमें एम.एस.ऑफ़िस के अंतर्गत समाविष्ट सभी सॉफ्टवेयरों में विभिन्न भारतीय लिपियों में काम करने की सुविधा मौजूद हैं। वस्तुत: विंडोज़ और एम.एस. ऑफ़िस की लोकप्रियता के कारण आज सभी कंपनियाँ भारत की विभिन्न लिपियों में फांट (font) एम.एस.ऑफ़िस (MS Office) के साथ ही देने लगी हैं, किन्तु 'स्पैल चैकर' और 'ऑन-लाइन' शब्दकोश की सुविधा कुछेक सॉफ्टवेयरों में ही उपलब्ध हैं।

विंडोज़ २००० के रिलीज़ के बाद यह महसूस किया जाने लगा था कि भारतीय भाषाओं को यदि परिचालन प्रणाली में अंतर्निहित नहीं किया गया तो उनमें अनेक कमियाँ रह जाएँगी। उदाहरण के लिए कोश निर्माण के लिए भारतीय भाषाओं की वर्णमाला के अनुरूप 'सॉर्टिंग' की सुविधा अत्यंत आवश्यक है और यह सुविधा आज मूल प्रणाली में हिंदी को अंतर्निहित करने के कारण अनायास ही सुलभ हो गई है। इसलिए यह कदम भारतीय भाषाओं में कंप्यूटिंग के क्षेत्र में अत्यंत महत्वपूर्ण सिद्ध होगा। विंड़ोज़ ऑपरेटिंग सिस्टम के बाद अब 'लोटस', 'लाइनेक्स' और 'ऑरेकल' कंपनियों ने भी घोषणा कर दी है कि वे भी यथाशीघ्र अपनी परिचालन प्रणालियों में हिंदी और अन्य भारतीय भाषाओं को समाहित कर लेंगी।

३. हिंदी में डीटीपी अर्थात डैस्क प्रकाशन

यह तो स्पष्ट ही है कि हिंदी और अन्य भारतीय भाषाओं में प्रकाशन कार्य में गुणात्मक सुधार लाने में 'इस्फॉक' (ISFOC) मानक फौंट की विशेष भूमिका है। इस कार्य के लिए भी सरकारी और ग़ैर-सरकारी दोनों ही स्तरों पर कई सॉफ्टवेयर विकसित किए गए हैं। इनमें प्रमुख हैं : समिट द्वारा विकसित 'इंडिका', एसआरजी द्वारा विकसित 'प्रकाशक' और सी-डैक द्वारा विकसित 'इज़्म पब्लिशर' या 'इज़्म सॉफ्ट' आदि। वस्तुत: हिंदी या अन्य भारतीय भाषाओं में प्रकाशन कार्य में क्रांति तब आएगी, तब लेखक स्वयं अपने कंप्यूटर पर अपनी पांडुलिपि को टंकित करेगा। उपयोक्ता की सुविधा के लिए सभी प्रमुख सॉफ्टवेयरों में हिंदी में तीन प्रकार के कुंजीपटलों की व्यवस्था है। लीप ऑफ़िस में ''Tool'' के अंतर्गत 'Option' से आप तीनों में किसी एक कुंजीपटल का चुनाव कर सकते हैं। यांत्रिक टाइपराइटर पर काम करने के अभ्यस्त टाइपिस्ट 'Typist' विकल्प का चुनाव कर सकते हैं ओर 'क्वेर्टी(querty)' कुंजीपटल पर रोमन लिपि में काम करने के अभ्यस्त प्रयोक्ता 'Phonetic English' का चुनाव कर सकते हैं, किंतु मूलत: कंप्यूटर पर ही टंकण सीखने वाले लेखकों और अन्य प्रयोक्ताओं के लिए 'इन्स्क्रिप्ट' (Inscript) कुंजीपटल का विकास किया गया है। इस कुंजीपटल में वर्णमाला का स्वाभाविक क्रम होने के कारण इसे सीखना बहुत सरल है। सी-डैक ने व्यक्तिगत स्तर पर लेखकों के लिए कुंजीपटल को सरल बनाने के लिए 'आई-लीप' (iLeap) नामक अत्यंत मैत्रीपूर्ण और कलात्मक इंटरफेस का विकास किया है। इसके माध्यम से लेखक न केवल अपनी पांडुलिपि स्वयं टंकित कर सकते हैं, बल्कि 'बहुभाषी स्पैल चैकर' की सहायता से उसमें प्रूफ संशोधन भी कर सकते हैं। प्रूफ संशोधन के बाद 'पेज-लेआउट' तैयार करके व्यक्तिगत स्तर पर प्रकाशन कार्य भी कर सकते हैं। 'वेब प्रकाशन' की अतिरिक्त सुविधा के कारण इसके ज़रिए लेखक या उपयोक्ता इंटरनेट पर अपना 'होमपेज' या 'वेबपेज' बना सकते हैं। इस सॉफ्टवेयर में सभी भारतीय भाषाओं में उक्त सभी सुविधाएँ मौजूद हैं। हाल ही में सी-डैक ने भारतीय कला-चित्रों (Cliparts) के संकलन 'शैली' और 'प्रतिबिंब' नाम से रिलीज़ किए हैं। इसमें रंगोली के चित्रों से लेकर अनेक भारतीय भाषाओं के प्रतीक 'क्लिपार्ट' के रूप में दिए गए हैं। इन्हें 'कोरल ड्रॉ', '३-डी स्टुडिओ' और वेब प्रकाशन के सॉफ्टवेयर के साथ भारतीय भाषाओं का संयोजन करते हुए इस्तेमाल किया जा सकता है।

४. इंटरनेट, ई-मेल और वेब पब्लिशिंग

आज विंडोज़ का अधुनातन 'वर्शन' (version) है विंड़ोज़ २०००। इसे 'विंडोज़ एनटी ५.०' कहा जाता है। इसी के अनुरूप माइक्रोसॉफ्ट कंपनी ने एम.एस. ऑफ़िस के अंतर्गत 'ऑफ़िस २०००' भी रिलीज़ किया है। इसमें विश्व की सभी जटिलतम लिपियों को समाहित किया गया है। इनमें प्रमुख हैं - अरबी, हिब्रू, थाई, देवनागरी और तमिल। वस्तुत: अभी तक 'विंडोज़' के अंतर्गत विभिन्न भाषाओं में मात्र कुंजीयन (keying) की सुविधा वैकल्पिक रूप में मौजूद थी, किंतु 'विंड़ोज़ २०००' के आगमन के कारण स्थानीय भाषाओं में 'इंटरफेस' की सुविधा भी उपलब्ध हो गई है अर्थात अब हम देवनागरी में न केवल संदेशों का आदान-प्रदान कर सकते हैं, बल्कि पाठों के कुंजीयन के साथ-साथ 'मेन्यु' (menu) भी देवनागरी में देख सकते हैं। 'युनिकोड' पर आधारित होने के कारण इसमें 'इस्की' कोडिंग प्रणाली का समावेश भी अनायास ही हो गया है। यद्यपि ई-मेल और वेब प्रकाशन की सुविधा 'विंड़ोज़-९५' और 'विंड़ोज़-९८' में भी उपलब्ध थी, लेकिन अब ये कार्य बहुत सरलता से भारतीय लिपियों में भी किए जा सकेंगे।

सी-डैक द्वारा विकसित 'आई-लीप', 'लीप-ऑफ़िस २.०' तथा आर.के.कंप्यूटर्स द्वारा विकसित 'सुविंड़ोज़' २.०' के माध्यम से न केवल ई-मेल के संदेशों का आदान-प्रदान देवनागरी में किया जा सकता है, बल्कि वैब-पेज भी हिंदी में लिखा जा सकता है, किंतु जहाँ आई-लीप और 'लीप-ऑफ़िस २.०' में यह सुविधा सभी भारतीय भाषाओं में सुलभ हैं, वहाँ 'सुविंड़ोज़ २.०' में यह सुविधा केवल देवनागरी में हैं, किंतु सी-डैक द्वारा 'हॉटमेल' के समकक्ष हिंदी और मराठी में 'मल्टीमेल' की सुविधा भी प्रदान की गई है। यह निश्चय ही क्रांतिकारी कदम है। इसके माध्यम से न केवल संदेशों का आदान-प्रदान हिंदी में किया जा सकता है, बल्कि 'कमांड' और 'मेन्यु' भी हिंदी में ही दिए गए हैं। उपयोक्ता अपना 'पासवर्ड' भी हिंदी में दे सकता है। इंटरनेट पर इसका पता इस प्रकार है : http:\\www.gist.cdac.org

रोमन लिपि के बढ़ते प्रभाव के कारण विश्व की अनेक लिपियाँ समाप्तप्राय हो गई हैं, किंतु भारतीय भाषाओं के संदर्भ में स्थितियाँ इतनी निराशाजनक नहीं हैं। सी-डैक ने इस क्षेत्र में भी चुनौती को स्वीकार किया है और मल्टी-मीडिया वीडियो कार्यों की एक पूरी श्रृंखला विकसित कर दी है। इसके अंतर्गत 'लिप्स' (Language Independent Program Sub–titles) नाम से एक सॉफ्टवेयर विकसित किया गया है, जिसके माध्यम से सभी भारतीय भाषाओं में फ़िल्मों के उप-शीर्षक (Sub–titles) हिंदी और अन्य भारतीय भाषाओं में तैयार किए जा सकते हैं। इसके फलस्वरूप अपने ड्राइंग-रूम में बैठकर अपनी पसंद की किसी भी भारतीय भाषा में विदेशी फ़िल्में भी देखी जा सकती हैं। टीवी पर भारतीय भाषाओं में समाचार-वाचन के लिए 'मल्टी प्रॉम्प्टर (Multi-Prompter) का विकास किया गया है जिसके ज़रिए समाचार-वाचक बिना काग़ज़ देखे समाचार पढ़ सकता है और स्क्रालिंग की गति को आवश्यकतानुसार नियंत्रित भी कर सकता है। 'मूव(Move)' (Multiscript Oneline Video Editor) एक ऐसा बहुभाषी अक्षर जनरेटर है, जिसके ज़रिए दूरदर्शन और फ़िल्मों में पात्रों के नाम भारतीय भाषाओं में अंकित किए जा सकते हैं। हिंदी और अन्य भारतीय भाषाओं में 'बटरफ्लाई (Butterfly) नाम से डबिंग स्टेशन भी विकसित किया गया है और हिंदी और अन्य भारतीय भाषाओं में सीडी बनाने के लिए 'केमेलियन (chameleon)' नामक साफ्टवेयर का विकास किया गया है। इसकी सहायता से किसी भी वीडियो को 'सीडी' में रूपांतरित किया जा सकता है।

इसके अलावा, 'मोटरोला' कंपनी ने सन १९९७ में देवनागरी और गुजराती में पेजर का निर्माण भी किया है और भारतीय भाषाओं में पेजर टैक्नोलॉजी के विकास के लिए ('ISCLAP( Indian Standard Code for Language Paging) के मानक का विकास किया था और यह मानक ISCII के ही अनुरूप है। इसके ज़रिए संदेशों का आदान-प्रदान पेजर पर भी हिंदी, मराठी और गुजराती में करना संभव हो गया है।

५. कृत्रिम बुद्धि (Artificial Intelligence) पर आधारित विशेषज्ञ प्रणालियों (Expert Systems) का विकास

कंप्यूटर टैक्नोलॉजी के अंतर्गत प्राकृतिक भाषा संसाधन (Natural Language Processing) के क्षेत्र में विश्वभर में अनेक विशेषज्ञ प्रणालियों (³expert systems) का विकास किया गया है, जिनके माध्यम से कंप्यूटर साधित भाषा शिक्षण, मशीनी अनुवाद और वाक्-संसाधन (Speech Processing) से संबंधित विभिन्न अनुप्रयोग विकसित किए गए हैं। इस संबंध में आई.आई.टी, कानपुर के सहयोग से हैदराबाद विश्वविद्यालय में 'अनुसारक' नाम से एक ऐसी स्वचलित मशीनी अनुवाद प्रणाली का विकास किया गया है जिसके माध्यम से विभिन्न भारतीय भाषाओं में परस्पर 'शाब्दिक अनुवाद' की व्यवस्था है। यह तो स्पष्ट ही है कि सभी भारतीय भाषाओं में वाक्य विन्यास एक जैसा है। यदि कहीं कुछ अंतर हैं भी तो वह अंतर इतना बड़ा नहीं हैं कि उससे 'अर्थ' का 'अनर्थ' हो जाए। यही कारण है कि अंग्रेज़ी से हिंदी में अनुवाद के लिए 'अनुसारक' प्रणाली सफल सिद्ध नहीं हो पाई है, किंतु भारतीय भाषाओं के संदर्भ में यह प्रणाली अपनी सीमाओं के बावजूद काफ़ी हद तक सफल मानी जा सकती है। आजकल यह कार्य आई.आई.टी हैद्राबाद में प्रो. राजीव संगल के निर्देशन में किया जा रहा है। अब तक 'अनुसारक' प्रणाली तेलुगु-हिंदी, कन्नड़-हिंदी, बंगला-हिंदी, मराठी-हिंदी और कुछ हद तक पंजाबी-हिंदी में भी विकसित की गई है।

इसके अलावा, राजभाषा विभाग, गृह मंत्रालय, भारत सरकार के सहयोग से सी-डैक के 'ए ए आई' ग्रुप ने भी 'मंत्र' (Machine assisted Translation Tool) नाम से एक ऐसी स्वचालित मशीनी अनुवाद प्रणाली विकसित की है जिसके माध्यम से नियुक्ति और पदोन्नति से संबंधित भारत के राजपत्र की अधिसूचनाओं को अंग्रेज़ी से हिंदी में अनूदित किया जा सकता है। यद्यपि इसका प्रयोग-क्षेत्र अत्यंत सीमित है, किंतु अधिसूचनाओं की जटिल वाक्य रचनाओं को देखते हुए यह प्रयास निश्चय ही सराहनीय है। इंटेल कंपनी की अनुशंसा पर 'स्मिथसोनियन' संस्था ने इसे सूचना प्रौद्योगिकी के क्षेत्र में अत्यंत साहसिक और सराहनीय कदम के रूप में स्वीकार किया है। इसके अलावा, इसी ग्रुप ने राजभाषा विभाग, गृह मंत्रालय, भारत सरकार के सहयोग से 'लीला प्रबोध' और 'लील प्रवीण' नामक स्वयं शिक्षक पैकेज भी विकसित किए हैं। ये पैकेज पूर्णत: मल्टीमीड़िया कंप्यूटर प्रणाली पर आधारित हैं और इनमें ध्वनि (speech), चित्रों (graphics) और एनिमेशन का भरपूर उपयोग किया गया है। इनमें अनेक प्रकार के वीडियो क्लिपिंग्स भी रखे गए हैं ताकि शिक्षार्थी बड़े जीवंत रूप में और सहजता से इसके ज़रिए हिंदी सीख सकें। 'हिंदी प्रवीण' का निर्माण भी अंतिम चरण में हैं।

६. हिंदी और अन्य भारतीय भाषाओं में कंप्यूटर संबंधी विभिन्न अनुप्रयोग

भारतीय भाषाओं में कंप्यूटर टैक्नोलॉजी के विकास के कारण आज जटिल से जटिल कंप्यूटर संबंधी अनुप्रयोगों में हिंदी और अन्य भारतीय भाषाओं का व्यापक रूप से प्रयोग किया जा रहा है। भारतीय रेल द्वारा आरक्षण व्यवस्था के कंप्यूटरीकरण के कारण आम आदमी को बहुत सुविधा हो गई है और अब यह सुविधा एक विशेष टैक्नोलॉजी के माध्यम से हिंदी में भी सुलभ करा दी गई है। इस कार्य में 'सी एम सी' और 'क्रिस' जैसी वैज्ञानिक संस्थाओं का प्रमुख योगदान है। भारत में होने वाले आम चुनावों के लिए करोड़ों मतदाताओं की सूचियाँ कंप्यूटर के माध्यम से हिंदी और अन्य भारतीय भाषाओं में तैयार की गई हैं। भारतीय चुनाव आयोग द्वारा वितरित अधिकांश परिचय-पत्र भी भारतीय भाषाओं में तैयार किए गए हैं। महाराष्ट्र बिजली बोर्ड की रसीदें कंप्यूटर के माध्यम से मराठी में छापी जा रही हैं। उड़ीसा के पटवारी अपनी ज़मीन से संबंधित रिकार्ड कंप्यूटर पर उड़िया में तैयार कर रहे हैं। आंध्र प्रदेश और तमिलनाडु में अनेक सरकारी कार्य क्रमश: तेलुगु और तमिल में संपन्न किए जा रहे हैं।

आज अनेक गौरव-ग्रंथ और महत्वपूर्ण सूचनाएँ भी सीडी के रूप में भारतीय भाषाओं में उपलब्ध होने लगी हैं। इनमें प्रमुख हैं : सी-डैक द्वारा विकसित 'ज्ञानेश्वरी' भारतीय चुनाव आयोग द्वारा तैयार की गई मतदाता सूचियाँ, कुछ निजी संस्थाओं द्वारा विकसित 'पंचतंत्र की कथाएँ' और गेटवे मल्टीमीडिया इंडिया लिमिटेड, अहमदाबाद द्वारा विकसित विशाल अंग्रेज़ी-हिंदी शब्दकोश।

७. निष्कर्ष:

आज हम अगली सदी और सहस्त्राब्दि (millennium) की दहलीज़ पर खड़े हैं। इसलिए आवश्यकता इस बात की है कि हम हिंदी और अन्य भारतीय भाषाओं के सामने आने वाली चुनौतियों को रेखांकित करें और उनका सामना करने के लिए आवश्यक उपाय करें। इस संदर्भ में मैं कुछ सुझाव उपस्थित विद्वज्जनों के सामने रखना चाहूँगा। मुझे विश्वास है कि यदि हमने इन सुझावों और प्रस्तावों के अनुरूप अपनी कार्य योजना बनाई तो नई सदी और सहस्त्राब्दि में हिंदी और अन्य भारतीय भाषाओं का भविष्य निश्चय ही उज्ज्वल होगा:

१. हिंदी के प्रमुख गौरव-ग्रंथों (classics) को चिह्नित करना और उन्हें सीडी के रूप में उपलब्ध कराना।
२. हिंदी में ओ.सी.आर.(Optical Character Recognition) का निर्माण।
३. अधिक से अधिक वैब ठिकानों में यथासंभव अधिकारिक सामग्री हिंदी और अन्य भारतीय भाषाओं में उपलब्ध कराना।
४. हिंदी में स्पीच इनपुट-आउटपुट सिस्टम विकसित करना।
५. पूर्णत: स्वचालित कंप्यूटर साधित मशीनी अनुवाद प्रणाली का विकास।

पृष्ठ: १. २. ३.