අපේ Google දෙයිය ගැන දන්නවද? අපි හැමදාමත් අමාරුවේ වැටුන වේලාවට අපේ පිහිටට එන මෙයා ගැන පොඩ්ඩක් ලියන්න හිතුනා.මටත් කලින් තිබුන ප්රශ්නය තමයි, කොහොමද Google Search Engine එක වැඩ කරන්නෙ කියල.මොකද මුහුදෙ අල්පෙනිත්තක් හොයනවා වගේ වැඩක් නේ මේක.ඉතින් මමත් පොඩ්ඩක් search පාරක් දැම්ම මේක ගැන.
Google Search Engine හි ක්රියාකාරීත්වය අපිට ප්රධාන අවස්ථා 3 කියන්න පුලුවන්,මේ හැම අවස්ථාවකම අපිට සාර්ථක සෙවුමකට උදව් වෙනවා,
1. Google’s Web Crawler හෙවත් Google Robots
Google’s Web Crawler වලින් කරන්නෙ වෙබ් පිටුවල තිබෙන තියන content කියවල අදාල content, Google Indexer එකට යවන එකයි. මම තව ටිකකින් කියනව මොකක්ද Google Indexer කියන්නෙ කියල. මෙයා හරියට මකුළුවෙක් වගේ. මකුලුවෙක් තමන්ගේ දැල වියනවා වගේ වෙබ් පිටු සැරිසරා ගිහිල්ල දත්ත එක රැස් කරල Google Indexer එකට යවනව. Google Robots ට එක සැරේට වෙබ් පිටු දහස් ගනනක තොරතුරු ලබා ගන්න පහසුකම් තියනවා.
Google Robots වෙබ් පිටු සොයන ආකාර 2 තියනවා.
* www.google.com/addurl.html එකෙන් අපිට පුලුවන් Google Robots ට අපේ වෙබ් පිටුවට එන්න කියල ආරාධනා කරන්න.
මේ url එකට ඔනම කෙනෙකුට තමන්ගෙ page එක දාල Google Robots ට page එක review කරන්න එන්න කියල ආරාධනා කරන්න පුලුවන්. ෂා....මරුනෙ spam කාරයින්ටත් ගූගල් එකේ එකට යන්න පුලුවන් කියල හිතෙනවා ඇති නේද..? නමුත් එහෙම වෙන්නේ නෑ.මොකද ගූගල් සමාගම hidden text, images, ads වාගේ තියන වෙබ් පිටු එකට දාන්නේ නෑ.
** Bulk Request යැවීම.
මේකෙන් කරන්නෙ මම ඉස්සෙල්ලා කිව්ව විදිහට වෙබ් browser එකක් වගේ වෙබ් පිටු දහස් ගනනකට එකපාර request යවනවා. එහෙම යවන්නෙත් දැනට ගූගල් Indexer ඒ වෙබ් පිටුව තියනවද නැද්ද කියල බලල නැත්නම් විතරයි.ඒ කියන්නේ අන්තර්ජාලේ තියන සහ දිනපතා එක්වන ලක්ෂ ගාණක් වෙබ් පිටු ඉතාම සුලු කාලෙකින් මේ Robot ට අහුවෙනවා.
2. Google’s Indexer
මේක හරියට පොතක පටුනකට සමාන කරන්න පුලුවන්,අපිට අවශය දේ තියන ස්ථානය ක්ෂණිව පෙන්නන්න සහ අදාල ස්ථානයට යොමු කරන්න Google Indexer උදව් වෙනවා.ලොකයේ තියන අනන්ත අප්රමාණ වෙබ් සයිට් වල තිබෙන අන්තර්ගතය Google Robots ල කියවල ,තිබෙන තැන පිලිබද විස්තර තියා ගන්නේ මේ Google Indexer වල. සෙවුම් වල නිවැරදි බව වර්ධනය සදහා the, is, on, or, of, how, why, as well as වාගේ වචන Google Indexer වල තබා ගන්නේ නෑ.
3. Google Query Processor.
අපි ගූගල් සෙවුමේ සදහන් කරන සෙවීම් වචන හදුන්වන්නේ Google Query ලෙසයි. මේ ගූගල් වෙබ් සර්වර් වලින් ගූගල් Indexer වෙත යොමු කෙරේ.ඉන් පසුව ගූගල් Query පිරික්ෂා ගූගල් Indexer මගින් අදාල වෙබ් අඩවි වල ලින්ක්,විමසන්නා වෙත යවනු ලැබේ, මෙය සිදුකරන්නේ ගූගල් doc servers වලිනි.
මේහිදී වෙබ් පිටු පෙන්වන පිලිවෙල සැලකෙන්නේ සුවිශේෂී Rant ක්රමයකටයි.මෙහිදී වෙබ් පිටුවේ ජනප්රියතාව,සෙවුම සහ වෙබ් පිටුවේ අන්තර්ගතය අතර ඇති සමාන බව,අවස්ථා කීයකදී එය වෙබ් පිටුවේ සටන්ව ඇත්ද?,වෙබ් පිටු වල යාවත්කාලීන දින,අන්තර්ගතය වෙනස් වීම්, මේ සදහා මූලික ලෙස බලපායි.
මෙම රූපසටහන අනුව අදාල ක්රියාවලිය මනාව පැහැදිලි වේ.
නමුත් මෙහෙම සර්ච් කරනකොට Spam Sites එහෙම ඔන තරම් එන්න පුලුවන් කියල හිතෙන්න වා. නමුත් ගූගල් එකෙන් බේරෙන්නත් විවිධ ක්රම පාවිචි කරනවා.
1. අන්තරගතය ක්ෂණිකව වෙනස් වන වෙබ් අඩවි හදුනා ගැනීම
Google Search Engine හි ක්රියාකාරීත්වය අපිට ප්රධාන අවස්ථා 3 කියන්න පුලුවන්,මේ හැම අවස්ථාවකම අපිට සාර්ථක සෙවුමකට උදව් වෙනවා,
1. Google’s Web Crawler හෙවත් Google Robots
Google’s Web Crawler වලින් කරන්නෙ වෙබ් පිටුවල තිබෙන තියන content කියවල අදාල content, Google Indexer එකට යවන එකයි. මම තව ටිකකින් කියනව මොකක්ද Google Indexer කියන්නෙ කියල. මෙයා හරියට මකුළුවෙක් වගේ. මකුලුවෙක් තමන්ගේ දැල වියනවා වගේ වෙබ් පිටු සැරිසරා ගිහිල්ල දත්ත එක රැස් කරල Google Indexer එකට යවනව. Google Robots ට එක සැරේට වෙබ් පිටු දහස් ගනනක තොරතුරු ලබා ගන්න පහසුකම් තියනවා.
Google Robots වෙබ් පිටු සොයන ආකාර 2 තියනවා.
* www.google.com/addurl.html එකෙන් අපිට පුලුවන් Google Robots ට අපේ වෙබ් පිටුවට එන්න කියල ආරාධනා කරන්න.
** Bulk Request යැවීම.
මේකෙන් කරන්නෙ මම ඉස්සෙල්ලා කිව්ව විදිහට වෙබ් browser එකක් වගේ වෙබ් පිටු දහස් ගනනකට එකපාර request යවනවා. එහෙම යවන්නෙත් දැනට ගූගල් Indexer ඒ වෙබ් පිටුව තියනවද නැද්ද කියල බලල නැත්නම් විතරයි.ඒ කියන්නේ අන්තර්ජාලේ තියන සහ දිනපතා එක්වන ලක්ෂ ගාණක් වෙබ් පිටු ඉතාම සුලු කාලෙකින් මේ Robot ට අහුවෙනවා.
2. Google’s Indexer
මේක හරියට පොතක පටුනකට සමාන කරන්න පුලුවන්,අපිට අවශය දේ තියන ස්ථානය ක්ෂණිව පෙන්නන්න සහ අදාල ස්ථානයට යොමු කරන්න Google Indexer උදව් වෙනවා.ලොකයේ තියන අනන්ත අප්රමාණ වෙබ් සයිට් වල තිබෙන අන්තර්ගතය Google Robots ල කියවල ,තිබෙන තැන පිලිබද විස්තර තියා ගන්නේ මේ Google Indexer වල. සෙවුම් වල නිවැරදි බව වර්ධනය සදහා the, is, on, or, of, how, why, as well as වාගේ වචන Google Indexer වල තබා ගන්නේ නෑ.
3. Google Query Processor.
අපි ගූගල් සෙවුමේ සදහන් කරන සෙවීම් වචන හදුන්වන්නේ Google Query ලෙසයි. මේ ගූගල් වෙබ් සර්වර් වලින් ගූගල් Indexer වෙත යොමු කෙරේ.ඉන් පසුව ගූගල් Query පිරික්ෂා ගූගල් Indexer මගින් අදාල වෙබ් අඩවි වල ලින්ක්,විමසන්නා වෙත යවනු ලැබේ, මෙය සිදුකරන්නේ ගූගල් doc servers වලිනි.
මේහිදී වෙබ් පිටු පෙන්වන පිලිවෙල සැලකෙන්නේ සුවිශේෂී Rant ක්රමයකටයි.මෙහිදී වෙබ් පිටුවේ ජනප්රියතාව,සෙවුම සහ වෙබ් පිටුවේ අන්තර්ගතය අතර ඇති සමාන බව,අවස්ථා කීයකදී එය වෙබ් පිටුවේ සටන්ව ඇත්ද?,වෙබ් පිටු වල යාවත්කාලීන දින,අන්තර්ගතය වෙනස් වීම්, මේ සදහා මූලික ලෙස බලපායි.
මෙම රූපසටහන අනුව අදාල ක්රියාවලිය මනාව පැහැදිලි වේ.
නමුත් මෙහෙම සර්ච් කරනකොට Spam Sites එහෙම ඔන තරම් එන්න පුලුවන් කියල හිතෙන්න වා. නමුත් ගූගල් එකෙන් බේරෙන්නත් විවිධ ක්රම පාවිචි කරනවා.
1. අන්තරගතය ක්ෂණිකව වෙනස් වන වෙබ් අඩවි හදුනා ගැනීම
2. ip address, name servers, registration dates and names, hosting location බැලීම
3.නිතරම ලින්ක් generate කිරීම
4.නොගැලපෙන අකුරු සහ Charters තිබීම
මේ සියලු ක්රම වලින් ගූගල් අපිට උත්සාහ කරන්නේ අපිව කොහොම හරි ගොඩ දාන්න. ඉතින් ගූගල්ට අපි සදා ණය ගැති එකයි.
Comments
Post a Comment
ඔබේ අදහස් මට සවියකි