கூகிள் தேடல் எவ்வாறு இயங்குகிறது /How Google Search Works

கூகிள் தேடல் என்பது நம் வாழ்வின் ஒரு முக்கிய அம்சமாக மாறிவிட்டது. கூகிளில் பல விஷயங்களை தேடி பார்க்கும் நீங்கள் அது எப்படி தேடிப்பிடித்து சமர்த்தாக உங்களுக்கு விடை கூறுகிறது என்று என்றாவது ஒரு நாள் தேடியதுண்டா? அத்தகைய அறிவுப்பசியோடு தேடியிருந்தால் இந்த பக்கம் உங்களுக்கு கிடைத்திருக்கும். வாழ்த்துக்கள், தொடர்ந்து படியுங்கள்.

இந்த ஆண்டு (2018) கணக்குப்படி உலகில் 180 கோடி வலைத்தளங்கள்  (websites) உள்ளன. இதில் உள்ள வலைப்பக்கங்களை (webpages) கணக்கிட்டால் சுமார் 30 லட்சம் கோடி (30 trillion webpages). ஒருவேளை வானத்தில் உள்ள நட்சத்திரங்களைவிட வலைப்பக்கங்கள் அதிகமாக இருக்குமோ என்று தோன்றுகிறது. ஒவ்வொரு முறை ஏதாவது ஒன்றை கூகிளில் தேடும்போது இந்த கோடானுகோடி பக்கங்களை அலசி ஆராய்ந்து உங்களுக்கு பதில் தரவேண்டும். அதிலும் முக்கியமாக தரவரிசைப்படுத்தி பயனுள்ள பக்கங்களை தரவேண்டும். இமயமலை உயரம்கொண்ட வைக்கோல் போரில் ஊசியை தேடுவதற்கு இணையான கடினமான செயலாகும்.  இத்தகைய செயற்கரிய செயலை எப்படி கூகிள் சில வினாடிகளில் செய்கிறது என்பதை பார்ப்போம்.

1) அட்டவணை தயாரித்தல் (Indexing of Webpages ) - ஒவ்வொரு தேடலிலும் எல்லா வலைப்பக்கங்களையும் புரட்டிப்பார்த்து துரிதமாக விடை கூறுவது கடினம். எனவே கூகிள் கிராலர் (Google Crawler ) என்னும் மென்பொருளை பய்னபடுத்தி உலகிலுள்ள அனைத்து வலைத்தளங்களை தேடி தன்னுடைய அட்டவணையில் குறிப்பெடுத்துக்கொள்ளும். ஒரு வலைத்தளத்தை இந்த கிராலர் அடையும்போது அதிலுள்ள வலைப்பக்கங்களை பட்டியலிட்டு ஒவ்வொரு பக்கத்தில் உள்ள இணைப்புகளை (page  links)தேடி செல்லும். இவ்வாறு ஒவ்வொரு பக்கத்தையும் தேடி மேலும் இந்த வலைத்தளத்தில் பக்கங்கள் இல்லை என்று கண்டறியும் வரை ஆழமாக ஆராய்ந்து வலைதளத்தின் சாரத்தை  குறிப்பெடுத்துக்கொள்ளும்.  எந்த மாதிரி வலைத்தளம், என்ன அடிப்படை விஷயங்கள் உள்ளன, முக்கிய வார்த்தைகள் (keywords) போன்ற தகவல்களை அட்டவணையில் பதிந்துகொள்ளும். உதாரணமாக, நீங்கள் ஒரு தமிழ்நாடு சமையல் குறிப்புக்கள் பற்றி வலைத்தளம் நடத்திவந்தால்,  கூகிள் கிராலர் இதை ஆராய்ந்து இத்தளம் தமிழ்நாடு சமையல் என்பதையும் என்ன முக்கியமான உணவு தயார் செய்யும் முறை உள்ளது என்பதையும் அறிந்துகொண்டு அட்டவணையில் பதிந்துகொள்ளும். யாரவது கூகிளில் தமிழ்நாடு சமையல் பற்றி தேடினால் தன்னுடைய அட்டவணையில் தேடி பொருத்தமான வலைத்தளங்களை அளிக்கும். இந்த கிராலர் எப்போதும் ஊர்ந்துகொண்டே புது தகவல்களை திரட்டிக்கொள்ளும்.

2) பகுத்தறிந்து தரவரிசைப்படுத்துதல் (page ranking) - மேற்கூறியவாறு தேடும்போது ஒரு குறிப்பிட்ட தேடலுக்கு லட்சக்கணக்கான வலைப்பக்கங்கள் இருக்கும். அதிலிருந்து தேடப்படும் கேள்விக்கு ஏற்ப சரியாக பொருந்திய தரமான விடையை தரவேண்டும். இல்லையேல், கூகிள் தேடல் பயனற்றதாகும். பொதுவாக, நாம் கூகிளில் தேடும்போது பல வலைப்பக்கங்கள் வந்தாலும் முதலில் இருக்கும் (top 10) வலைப்பக்கங்களையே நாம் திறந்து பார்ப்போம். எனவே துல்லியமான தகவலை இந்த டாப் டென்னில் கொடுப்பது இன்றியமையாத சவாலான செயலாகும். அது எவ்வாறு நடக்கிறது என்று பார்ப்போம்.

கூகிள் பேஜ் ரேங்க் (Page Rank ) என்னும் நூதனமான முறையை கையாண்டு நமக்கு தேவையான தேடல் முடிவுகளை தருகிறது. கூகிளின் நிறுவனர்கள் லாரி பேஜ் (Larry Page ) மற்றும் செர்ஜி பிரின் (Sergey Brin ) ஆவர். இந்த இருவரும் சேர்ந்து வலைப்பக்கங்களை தரம் பிரிக்கும் மகத்தான வழிமுறையை கண்டுபிடித்தனர். இந்த வழிமுறைக்கு பேஜ் ரேங்க் என லாரி பேஜ் பெயரையே சூட்டினர். பேஜ் ரேங்க் எப்படி செயல்படுகிறது என்பதை பார்போம்.

கல்லூரியில் ஒரு மாணவர் கூட்டத்தில் சென்று அந்த கூட்டத்தின் தலைவன் யார் கேட்டால்  மாணவர்கள் ஒவ்வொருவரும் யாராவது ஒருவனை ஆள்காட்டி விரலால் சுட்டி காண்பிப்பார்கள். அந்த கூட்டத்தில் பலர் இருந்தாலும் ஒரு சிலரே தலைவர் என சகா மாணவர்களால் அடையாளம் காணப்படுவர். இதே தத்துவத்தை பயன்படுத்தி கூகிள் வலைப்பக்கங்களை ஆராய்கிறது. ஒரு வலைப்பக்கத்தை எடுத்துக்கொண்டு அந்த பக்கத்திற்கு மற்ற எத்தனை வலைப்பக்கங்கள் இணைப்பு கொடுக்கின்றன என்பதை கணக்கிட்டு பேஜ் ரேங்க் ஸ்கோர் கணக்கிடும். இன்னொரு முக்கிய விஷயம் என்னவென்றால் ஒரு வலைப்பக்கத்திற்கு பல இணைப்புக்கள் இருந்தாலும் அவற்றின்  தரமும் முக்கியம். நான் மேற்குறிய உதாரணத்தை மீண்டும் எடுத்து கொள்வோம், இப்போது கல்லூரி ஆசியர்களிடம் எந்த மாணவன் தலைவன் என கேட்டால் அவர்களும் தம் பதிலை கூறுவர். மாணவர்களும் ஆசிரியர்களும் யாரை தலைவன் என கருதுகிறார்களோ அவனே தலைவன் ஆவான். இதேபோல், ஒரு வலைப்பக்கத்திற்கு பல இணைப்புக்கள் இருந்தாலும் யார் இணைப்பு தருகிறார்கள் என்பதையும் கணக்கிட்டு அதற்குகேற்ப பேஜ் ரேங்க் அளிக்கப்படும். அதிக பேஜ் ரேங்க் வாங்கும் வலைப்பக்கங்கள் முதலில் டாப் டென்னில் தோன்றும்.

Image Courtesy - wikipedia 


மீண்டும் உதாரணமாக நீங்கள் ஒரு தமிழ்நாடு சமையல் குறிப்பு வலைத்தளம் ஆரம்பித்தால் முதலில் கூகிள் தேடலில் இடம்பெறாது . நீங்கள் உங்கள் நண்பர்கள் உறவினர்களை உங்கள் வலைத்தளத்தை பார்க்குமாறு அழைப்பீர்கள். அவர்களில் யாரேனும் அவர்களுடைய வலைத்தளம் அல்லது ப்ளாகில் உங்களுடைய வலைத்தளம் பற்றி குறிப்பிட்டு இணைப்பு கொடுக்கும்போது உங்கள் பேஜ் ரேங்க் சிறிது கூடும். இதுவே தினத்தந்தி போன்ற மிகவும் பிரபலமான வலைத்தளம் உங்கள் வலைப்பக்கத்திற்கு இணைப்பு கொடுத்தால் உங்கள் பேஜ் ரேங்க் கிடுகிடுவென உயர்ந்து டாப் டென்னில் வரும் வாய்ப்பு கூடும்.

இந்த அடிப்படை தேடல் முறையை காலத்திற்கேற்ப சில மாறுதல்களோடு கூகிள் தன்னுடைய தேடும் யுக்தியை தொடர்ந்து செயல்படுத்திவருகிறது. அவற்றில் சில - கிரிக்கெட் பற்றி ஒருவர் தேடுகிறார் என்றால் கிரிக்கெட் விளையாடும் நாடுகளிலுள்ள வலைப்பக்கங்களுக்கு முன்னுரிமை அளிக்கப்படும். மேலும் நீங்கள் கேட்கும் கேள்விக்கு இணையான வேறு வார்த்தைகள் கொண்டு (Query rewriting ) கேள்விகளை உருவாக்கி தேடி சிறந்த பத்திகளை அளிக்கும்.

கூகிள் சந்திக்கும் சில முக்கிய பிரச்சனைகளை காண்போம். வாக்காளர்களுக்கு பணம் கொடுத்து வோட்டு வாங்கும் அரசியல்வாதிகளைப்போல் வலைப்பக்கங்களுக்கு காசு வாங்கிக்கொண்டு இணைப்பு கொடுக்கும் ரகசிய நிறுவனங்கள் பல உள்ளன. இவை லிங்க் பார்ம்ஸ் (Link Farms ) எனப்படும். இந்த போலியான இணைப்புகளை தொடர்ந்து கண்டறிந்து களை எடுத்துக்கொண்டுதான் இருக்கிறது கூகிள்.

முடிவாக கூறினால், உங்கள் வலைத்தளம் டாப் டென்னில் வரவேண்டுமென்றால் நீங்கள் சொல்ல வரும் கருத்து உண்மையில் பயனுள்ளதாகவும் தனித்தன்மையோடும் இருக்கவேண்டும்.

கூகிளில் தேடி அறிவை வளர்ப்பீர்!
உங்களுக்குள் தேடி ஆத்ம ஞானம் அடைவீர்!

Happy Searching!











Comments