गूगल से आगे डीप वेब की अथाह दुनिया - गूगल से आगे डीप वेब की अथाह दुनिया DA Image
11 दिसंबर, 2019|6:04|IST

अगली स्टोरी

class="fa fa-bell">ब्रेकिंग:

गूगल से आगे डीप वेब की अथाह दुनिया

आज गूगल ऑनलाइन सर्च का पर्याय बन चुका है। कोड भाषा (एल्गरिथम्स) में चलने वाले यह सर्च इंजन हमारे द्वारा सर्च आदेश देते ही नतीजे सामने रख देता है और हमें एहसास होता है कि सारी सूचना हमारे पास उपलब्ध हो गई। बेशक अक्सर इस्तेमाल होने वाले सर्च इंजन अधिकांश वेब खंगाल लेते हैं लेकिन कई साइट्स हैं जो उनकी प्राथमिकताओं में काफी नीचे आती हैं। इसलिए ऐसी कई साइट्स हैं जो कभी आपके सामने नहीं पहुंचेंगी। लिहाजा, डीप वेब में आपका स्वागत है।

सीमित सर्च
हरेक सर्च इंजन में स्पाइडर, क्रॉलर या बॉट जैसे प्रोग्राम मौजूद रहते हैं जो लगातार इंटरनेट पर उपस्थित रहते हैं। यह प्रोग्राम सभी साइटों को उनके कंटेंट की अहमियत के अनुरूप तरतीबवार लगाता है। वेबसाइटों को खोजते हुए बॉट्स भी आपकी साइटों पर नजर रखते हुए अपनी पहचान छोड़ते चलते हैं। कोडिंग के आधार पर कोई सर्च इंजन या तो साइट को बिना सूचीगत किए रख देता है या फिर उसके कंटेंट की इंडेक्सिंग करके उसके हाइपरलिंक्स को तलाशता है। स्पाइडर आधारित वेबसाइटों की निरंतर उपस्थिति किसी भी सर्च इंजन की गुणवत्ता पर निर्भर करती है।

हालांकि, फिक्स्ड कोडिंग पर चलने वाले सर्च इंजनों की कुछ सीमाएं भी होती हैं जिससे वे कई बार बेतरतीब नतीजे देता है क्योंकि सर्च इंजन खोज आदेश पर जरूरी कंटेंट को नहीं खोज पाता। साथ ही, सर्च इंजन केवल क्रॉल स्टेटिक वेब पेजों को ही खोजता है, जबकि नेट पर सूचना डाटाबेसों में स्टोर रहती है, जिसे स्पाइडर नहीं खोज पाते। सर्च रिजल्ट अनेक डाटाबेसों तक पहुंचने में असफल रहता है, जैसे कि यूनिवर्सिटी और सरकारी संस्थानों और अन्य में। यह संख्या बहुत बड़ी हो जाती है जिससे प्रेषित सूचना कुल डाटा का बहुत छोटा प्रतिशत होती है।

डिकोडिंग कंटेंट
तो सबसे तार्किक सवाल उठता है, यदि गूगल डाटा नहीं खोज पाता तो डाटा कहां है और उसे कैसे प्राप्त किया जा सकता है?  चलिए डीप वेब को कंटेंट के आधार पर डिकोड किया जाए। एक डाटाबेस सूचना को टेबल्स में स्टोर करता है जो एक्सेस, एसक्यूएल या ओरेकल जैसे प्रोग्रामों से बनता है। यह डाटा केवल एक प्रश्न के जवाब में भी प्राप्त हो सकता है। प्रश्न के उत्तर में डाटाबेस निर्धारित सूचना सामने आती है। यह क्रिया स्टेटिक वेब पेजों को खोजे जाने से काफी भिन्न है जिसे क्रॉलर्स सीधे एक्सेस कर सकते हैं।

फीडरेटेड सर्च
तो आइए ऐसे तरीके खोजें जिससे हम इस सूचना को प्राप्त कर सकें। जाने-माने सर्च इंजन लिंक्स के लिए वेबसाइटों को खंगालते हैं, लेकिन वह डाटाबेस को नहीं सर्च कर पाते। फीडरेटेड सर्च इंजन ऐसी श्रेणी है जो अनेक ऑनलाइन डाटाबेसों और वेब स्त्रोतों को खोजती है।

अमेरिका के यूटा विश्वविद्यालय के स्कूल ऑफ कंप्यूटिंग की एसोसिएट प्रोफेसर जुलियाना फ्रेरी और उनकी टीम इस दिशा में डीपपीप (www.deeppeep.org) लेकर आई हैं। इससे कैजुअल और एक्सपर्ट यूजर्स के लिए पब्लिक डाटाबेस खंगाले जा सकेंगे। फ्रेरी कहती हैं, ‘डीपपीप एक वर्टिकल सर्च इंजन है : यह वेब फॉमर्स विशेष होता है - जिसमें छुपे कंटेंट के एंट्री प्वाइंट्स का पता रहता है। मौजूदा समय में, हम 45,000 पेजों की इंडेक्सिंग कर रहे हैं जिनमें फॉर्म हैं और जो सात विभिन्न डोमेन्स पर उपलब्ध हैं।’

फ्रेरी के अनुसार, अनेक मुख्यधारा वेबसाइटें एक खास सीमा तक डीप वेब सर्च कर रही हैं। वह बताती हैं, ‘किसी सर्च इंजन में दृश्य एवं छुपी हुई वेब सूचना को जोड़ सकने की काबिलियत ही उच्चकोटि की सूचना यूजर्स के समक्ष लाती है। लेकिन यदि उसे ठीक से न इस्तेमाल किया जाए, तो उससे अनेक यूजर्स सूचना के इंतजार में बैठे रह सकते हैं।’

फीडरेटेड सर्च : पक्ष और विपक्ष
समय की बचत : फीडरेटेड सर्च इंजन शोधार्थियों के लिए बहुत लाभदायक होते हैं क्योंकि इससे समय की बचत होती है। यह इंजन एक साथ ही अनेक डाटाबेसों में सर्च करता है जिससे यूजर को कुछ खोजने के लिए अलग-अलग साइटों पर नहीं जाना पड़ता। वह अनेक डाटाबेसों की सर्च एक वेब पेज पर ले आते हैं।

नतीजों की गुणवत्ता : किसी एक फीडरेटेड सर्च के नतीजे उसी विषय पर किसी पॉपुलर सर्च इंजन के नतीजों से बेहतर होते हैं। ऐसा इसलिए क्योंकि फीडरेटेड सर्च उन संस्थानों के डाटाबेसों से सूचना एकत्र करता है जो दिए गए विषय के आधिकारिक ज्ञाता होते हैं।

रीयल-टाइम सर्च : फीडरेटेड सर्च रीयल-टाइम सर्चिग करता है, जो आपको आपकी जरूरत के अनुसार सबसे पुख्ता सूचना देता है। पॉपुलर सर्च इंजनों में सर्च नतीजे केवल क्रॉलरों द्वारा ही वेब सर्फिग के दौरान बदली जाती है। डीप वेब सर्च इंजन सर्च हरेक प्रश्न पर सभी स्त्रोतों को खंगालता है। तो जैसे ही पेरेंट डाटाबेस में नया डॉक्यूमेंट शामिल किया जाता है, सर्च में वह सामने आ जाता है।

हालांकि, फीडरेटेड सर्च इंजन में पॉपुलर सर्च इंजन की बजाय सूचना खोजने में समय लगता है। ऐसा इसलिए फीडरेटेड सर्च डाटाबेस सर्च की सूचना खोजने की रफ्तार पर निर्भर करता है। अधिकांश फीडरेटेड सर्च इंजन सूचना प्राप्त होते ही उसे सामने ले आते हैं। तो अगली बार जब आप वेब पर लॉग ऑन करें, तो अपनी सर्च को केवल पॉपुलर सर्च इंजनों तक ही सीमित न रखें। डीप वेब पर भी सर्च का प्रयास करें।

  • Hindi Newsसे जुडी अन्य ख़बरों की जानकारी के लिए हमें पर ज्वाइन करें और पर फॉलो करें
  • Web Title:गूगल से आगे डीप वेब की अथाह दुनिया