අපේ Google දෙයිය ගැන දන්නවද? අපි හැමදාමත් අමාරුවේ වැටුන වේලාවට අපේ පිහිටට  එන මෙයා ගැන පොඩ්ඩක් ලියන්න හිතුනා.මටත් කලින් තිබුන ප්‍රශ්නය තමයි, කොහොමද Google Search Engine එක වැඩ කරන්නෙ කියල.මොකද මුහුදෙ අල්පෙනිත්තක් හොයනවා වගේ වැඩක් නේ මේක.ඉතින් මමත් පොඩ්ඩක්  search පාරක් දැම්ම මේක ගැන.

Google Search Engine හි ක්‍රියාකාරීත්වය අපිට ප්‍රධාන අවස්ථා 3 කියන්න පුලුවන්,මේ හැම අවස්ථාවකම අපිට සාර්ථක සෙවුමකට උදව් වෙනවා,
1. Google’s Web Crawler හෙවත්  Google Robots
Google’s Web Crawler වලින් කරන්නෙ වෙබ් පිටුවල තිබෙන තියන content කියවල අදාල content, Google Indexer එකට යවන එකයි. මම තව ටිකකින් කියනව මොකක්ද Google Indexer කියන්නෙ කියල. මෙයා හරියට මකුළුවෙක් වගේ. මකුලුවෙක් තමන්ගේ දැල වියනවා වගේ වෙබ් පි‍ටු සැරිසරා ගිහිල්ල දත්ත එක ‍රැස් කරල Google Indexer එකට යවනව. Google Robots ට එක සැරේට වෙබ් පි‍ටු දහස් ගනනක තොරතුරු ලබා ගන්න පහසුකම් තියනවා.

Google Robots වෙබ් පි‍ටු සොයන ආකාර 2 තියනවා.
www.google.com/addurl.html එකෙන් අපිට පුලුවන්  Google Robots  ට අපේ වෙබ් පි‍ටුවට එන්න කියල ආරාධනා කරන්න.

මේ url එකට ඔනම කෙනෙකුට තමන්ගෙ page එක දාල Google Robots ට page  එක review කරන්න එන්න කියල ආරාධනා කරන්න පුලුවන්. ෂා....මරුනෙ spam කාරයින්ටත් ගූගල් එකේ එකට යන්න පුලුවන් කියල හිතෙනවා ඇති නේද..? නමුත් එහෙම වෙන්නේ නෑ.මොකද ගූගල් සමාගම hidden text, images, ads වාගේ තියන වෙබ් පි‍ටු එකට දාන්නේ නෑ.


**  Bulk Request යැවීම.
මේකෙන් කරන්නෙ මම ඉස්සෙල්ලා කිව්ව විදිහට වෙබ් browser එකක් වගේ වෙබ් පි‍ටු දහස් ගනනකට එකපාර request යවනවා. එහෙම යවන්නෙත් දැනට ගූගල් Indexer  ඒ වෙබ් පි‍ටුව තියනවද නැද්ද කියල බලල නැත්නම් විතරයි.ඒ කියන්නේ අන්තර්ජාලේ තියන සහ දිනපතා එක්වන ලක්ෂ ගාණක් වෙබ් පි‍ටු ඉතාම සුලු කාලෙකින් මේ Robot  අහුවෙනවා.


2. Google’s Indexer

මේක හරියට පොතක පටුනකට සමාන කරන්න පුලුවන්,අපිට අවශය දේ තියන ස්ථානය ක්ෂණිව පෙන්නන්න සහ අදාල ස්ථානයට යොමු කරන්න Google Indexer උදව් වෙනවා.ලොකයේ තියන අනන්ත අප්‍රමාණ වෙබ් සයිට් වල තිබෙන අන්තර්ගතය Google Robots ල කියවල ,තිබෙන තැන පිලිබද විස්තර තියා ගන්නේ මේ Google Indexer වල. සෙවුම් වල නිවැරදි බව වර්ධනය සදහා  theisonorofhowwhy, as well as වාගේ වචන Google Indexer  වල තබා ගන්නේ නෑ.


3. Google Query Processor.


අපි ගූගල් සෙවුමේ සදහන් කරන සෙවීම් වචන හදුන්වන්නේ Google Query ලෙසයි. මේ ගූගල් වෙබ් සර්වර් වලින් ගූගල් Indexer වෙත යොමු කෙරේ.ඉන් පසුව ගූගල් Query  පිරික්ෂා ගූගල් Indexer මගින් අදාල වෙබ් අඩවි වල ලින්ක්,විමසන්නා වෙත යවනු ලැබේ, මෙය සිදුකරන්නේ ගූගල් doc servers වලිනි.
මේහිදී වෙබ් පිටු පෙන්වන පිලිවෙල සැලකෙන්නේ සුවිශේෂී Rant ක්‍රමයකටයි.මෙහිදී වෙබ් පිටුවේ ජනප්‍රියතාව,සෙවුම සහ වෙබ් පිටුවේ අන්තර්ගතය අතර ඇති සමාන බව,අවස්ථා කීයකදී එය වෙබ් පිටුවේ සටන්ව ඇත්ද?,වෙබ් පිටු වල යාවත්කාලීන දින,අන්තර්ගතය වෙනස් වීම්, මේ සදහා මූලික ලෙස බලපායි.






මෙම රූපසටහන අනුව අදාල ක්‍රියාවලිය මනාව පැහැදිලි වේ.


නමුත් මෙහෙම සර්ච් කරනකොට Spam Sites එහෙම ඔන තරම් එන්න පුලුවන් කියල හිතෙන්න වා. නමුත් ගූගල් එකෙන් බේරෙන්නත් විවිධ ක්‍රම පාවිචි කරනවා.
1. අන්තරගතය ක්ෂණිකව වෙනස් වන වෙබ් අඩවි හදුනා ගැනීම
2. ip address, name servers, registration dates and names, hosting location බැලීම
3.නිතරම ලින්ක් generate කිරීම 
4.නොගැලපෙන අකුරු සහ Charters තිබීම

මේ සියලු ක්‍රම වලින් ගූගල් අපිට උත්සාහ කරන්නේ අපිව කොහොම හරි ගොඩ දාන්න. ඉතින් ගූගල්ට අපි සදා ණය ගැති එකයි.

Comments

Popular posts from this blog

New Apple IPhone 3G S Comes Out

ජීව්තයට බුදුදහමෙන් බිදක්

“හිස් පුද්ගලයන්ගේ නින්දා අපහාස කිසිසේත්ම ගණන් ගත යුතු නැහැ”