আমরা ইন্টারনেট ব্যবহার করি৷ ইন্টারনেটে আমাদের প্রয়োজনীয় তথ্য অনুসন্ধান করি৷ বিভিন্ন ওয়েব সাইটে এক্সেস করি৷ এগুল সহ ইন্টারনেটের প্রায় সবগুলো কাজ সার্চিংয়ের পরেই শুরু হয়৷ কিন্ত কখনো কি ভেবে দেখেছি এই সার্চ ইঞ্জিন কি? সার্চ ইঞ্জিন কিভাবে কাজ করে এই সার্চ ইঞ্জিন? এই পোস্টে এ বিষয় নিয়েই আলোচনা হতে যাচ্ছে৷
সার্চ ইঞ্জিন কি?
Search Engine (সার্চ ইঞ্জিন) হচ্ছে এক ধরনের এলগরিদম (algorithm) যা ইন্টারনেট জগতের তথ্যগুলো নিজের সংগ্রহে রাখে এবং আপনি যখন-ই তাতে কোন কিছু সার্চ করবেন তখন সে নিজের কাছে জমা থাকা তথ্য থেকে আপনার কাছে সার্চের একটি ফলাফল বা রেজাল্ট উপস্থিত করে দেয় যা আপনি আপনার কম্পিউটার স্ক্রীনে দেখতে পান।
সার্চ ইঞ্জিন কিভাবে কাজ করে?
সার্চ ইঞ্জিন মৌলিক তিনটি প্রোগ্রাম এর মাধ্যমে কাজ করে থাকে৷
সার্চ ইঞ্জিনের তিন টি প্রোগ্রাম-
সার্চ ইঞ্জিন এর কিছু মেইন প্রোগ্রাম রয়েছে৷ যেগুলো সার্চ ইঞ্জিন সফওয়্যার সচল ভাবে কাজ করার জন্য আবশ্যক৷ যেমনটি মোবাইলের সাথে ব্যাটারি আর চার্জারের আবশ্যক৷
তা হলো-
- Crawling (ক্রলিং) বা বুট
- Indexing (ইনডেক্সিং)
- Ranking (র্যঙ্কিং)
Crawling
সার্চ ইঞ্জিনের প্রথম কাজ হল- ইন্টারনেটে থাকা ওয়েব সাইট গুলো ক্রলিং বা বুট করতে থাকে৷ এটা তার প্রথম কাজ যেখানে কিছু automatic bots,বা ইন্টারনেট জগতের net of spider (মাকরসার জাল) যেগুলোকে আমরা crawler (ক্রলার) বলি, তা সম্পূর্ণ World Wide Web এর মধ্যে ঘুরে ঘুরে তথ্য (information) সংগ্রহ করে। এই crawlers (ক্রলার) গুলো অসংখ্য ওয়েবসাইট গুলোতে গিয়ে সেই ওয়েবসাইট গুলোর content এবং pages গুলোকে scan করে।
তো এই crawler গুলো, ওয়েবসাইট গুলোতে থাকা বিভিন্ন link গুলোর মাধ্যমে একটি website থেকে আরেকটি website এর মধ্যে চলে যায়। আর এভাবেই, সম্পূর্ণ world wide web এর মধ্যে “ক্রলার” গুলো ঘুরে ঘুরে তথ্য সংগ্রহ করে থাকে৷ এভাবেই “ক্রলার” গুলো ওয়েবসাইটের বিভিন্ন ধরণের তথ্য সংগ্রহ করে৷
- যেমন- content এর মধ্যে কি কি কিওয়ার্ড রয়েছে?
- ওয়েবপেজ এর হেড লাইন এবং সাইট টিতে কিসের বিষয়ে তথ্য রয়েছে?
- ছবি বা ভিডিও রয়েছে কি না৷
- ওয়েবসাইটটি সময়ে সময়ে নিয়মিত আপডেট হচ্ছে কি না?
- Website এর মধ্যে কতটি page রয়েছে’?
- ওয়েবসাইট এর মধ্যে কি কি internal এবং external links রয়েছে।
ইত্যাদি আরও অনেক কিছু৷ এতো গেল প্রথম কাজ৷ এরপর সার্চ ইঞ্জিন এর দ্বিতীয় কাজ হল- “Indexing“ (ইনডেক্সিং)
Indexing
Indexing হলো একটি সাধারণ প্রক্রিয়া প্রসেস৷ যেখানে সার্চ ইঞ্জিন গুলো তার ক্রলার দ্বারা ক্রল বা বুট করা ওয়েবসাইট গুলোর সম্পূর্ণ ডাটা গুলোকে তার database এর মধ্যে store করে রাখে। যার ফলে যখন কোন ইন্টারনেট ইউসার সার্চ ইঞ্জিন এর মধ্যে সার্চ করেন, তখন অনেক তাড়াতাড়ি সেই স্টোর করা database থেকে তথ্য গুলোকে সংগ্রহ করে সামনে দেওয়া হয়।
সার্চ ইঞ্জিন গুলো প্রতিদিন অগনিত ওয়েবসাইট গুলোকে বুট করতে থাকে৷ এবং তারপর index করে। এমনকি যত গুলো ওয়েবসাইট ইন্টারনেটে আছে, সেগুলোর প্রায় প্রত্যেকটি ওয়েবসাইট এই সার্চ ইঞ্জিন গুলো বুট ও index করে থাকে।
Indexing কে আরও সহজ বাংলায় বলতে গেলে বলা যায় সারা পৃথিবীর সকল ওয়েবসাইট গুলোকে সে তার ডাটাবেজে গুছিয়ে রাখে। মানে, কোন সাইটে ক্রল করে যদি দেখে সেটি নিউজ পেপার রিলেটেড সাইট তাহলে সেটা এক জায়গায় রাখে, আবার মুভি রিলেটেড সাইট গুলোকে আরেক জায়গায় গুছিয়ে রাখে। এতে করে পরবর্তীতে খুঁজে বের করতে সুবিধা হয়।
এবার আসি সার্চ ইঞ্জিনের তৃতীয় কাজ নিয়ে-
Ranking
Ranking হচ্ছে সার্চ ইঞ্জিন এর কাজ করার তৃতীয় এবং শেষ প্রক্রিয়া৷ এখানে website ranking এর সিদ্ধান্ত নেওয়া হয়। মানে, কোন keyword যখন search engine এর দ্বারা search করা হবে, তখন, কোন কোন ওয়েবসাইট গুলোকে সার্চ করা keyword এর জন্য search result page এর কত নম্বরে দেখান হবে সেটার সিদ্ধান্ত নির্ধারন করে দেয় এই প্রোগ্রাম৷
এটি মূলত একটি এলগরিদমের মাধ্যমে নির্ধারণ করা হয় কিন্তু কোন সার্চ ইঞ্জিন তার এলগরিদম কখনই প্রকাশ করে না। তবে ধারনা করা হয় নিচের বিষয়াবলীর উপর বিবেচনা করেই সার্চ ইঞ্জিন তার র্যাংকিং করে থাকে।
কন্টেন্ট ইজ কিং। মানে সার্চ ইঞ্জিনের প্রথম বিবেচনা হল কন্টেন্ট। যে কন্টেন্ট যত ইনফরমেটিভ গুগল তত বেশি গুরুত্ব দেয় সেই সাইটকে।
ব্যাকলিংক হল এলগরিদমের আরেকটি ইম্পরট্যান্ট ইন্ডেক্স। ডু-ফলো ব্যাকলিংক এর মাধ্যমে র্যাংকিং বাড়তে পারে।
অন-পেজ এসইও আপনাকে র্যাংকিং বাড়াতে সাহায্য করবে।
সার্চ ইঞ্জিনের প্রয়োজনীয়তা-
সার্চ ইঞ্জিন ছাড়া খুব অল্প লোক-ই ইন্টারনেট ইউস করতে পারবে৷ বলতে গেলে প্রায় অসম্ভব৷ যারা আবার পারবে তারা হয়ত মুখস্ত কয়েকটি সাইটেই প্রবেস করতে পারবে৷ নেট জগতের বিস্তৃত তথ্য তাদের অধরাই থেকে যাবে৷ আপনি নিজেও পরীক্ষা করে দেখতে পারেন৷ আজকেই সার্চ ইঞ্জিন ছাড়া নেট ইউস যাচাই করে দেখতে পারেন৷
সার্চ ইঞ্জিন অপ্টিমাইজেশন কি?
সার্চ ইঞ্জিন অপ্টিমাইজেশনকে সংক্ষেপে বলা হয় SEO যার পূর্ণ রূপ হচ্ছে “Search Engine Optimization” (সার্চ ইঞ্জিন অপ্টিমাইজেশন)। SEO হচ্ছে কোন কি ওয়ার্ডের বিপরীতে কোন সাইট বা পেইজকে সার্চ রেজাল্টে তার বর্তমান অবস্থান থেকে ক্রমান্নয়ে উপরে দিকে নিয়ে আসার পক্রিয়া। মনে রাখবেন এটা কোন প্রোগ্রাম বা সফটওয়্যার নয় এটা একটা প্রক্রিয়া বা প্রসেস।
আমরা গুগল বা অন্য যে কোন সার্চ বারে কোন কি ওয়ার্ড লিখে সার্চ করলে ফলাফলের একেবারে উপরে যা আছে৷ তাকে SEO তে টপ মনে করা হয়৷ আশা করি এবার বুঝতে পেরেছেন৷
সার্চ ইঞ্জিনের নাম-
বর্তমানে ইন্টারনেট জুড়ে অনেক সার্চ ইঞ্জিন আছে৷ দিন যত গড়াচ্ছে সেই সাছে পাল্লা দিয়ে বাড়ছে সার্চ ইঞ্জিন৷ সেগুলো থেকে-ই কিছু সার্চ ইঞ্জিনের নাম নিচে উল্লেখ করছি৷
গুগল সার্চ ইঞ্জিনের ব্যাপারে নতুন কিছু বলার নেই৷ সবাই এর সাথে পরিচিত৷ এমনকি নেট জগতের শুরু-ই হয় সাধারণত গুগল দিয়ে৷
Startpage
startpage আমার পছন্দের ইঞ্জিন গুলোর একটি৷ এটি আপনি brave, firefox, opera বা যে কোন ব্রাউজারে সিলেক্ট করে সহজেই ব্যবহর করতে পারবন৷
duckduckgo
অধিকাংশ সিকিউরিটি এক্সপার্টদের মতামত হল সিকিউরিটির জন্য duckduckgo সার্চ ইঞ্জিন ব্যবহার করা যেতে পারে৷ এটিও আপনি brave, firefox,opera বা যে কোন ব্রাউজারে সিলেক্ট করে সহজেই ব্যবহর করতে পারবন৷
ইয়াহু বহুল ব্যবহৃত একটি সার্চ ইঞ্জিন৷ এটিও ব্রাউজার গুলোর সার্চ সেটটিংসে সাধারণত সেট করা থাকে৷
Searx
searx সার্চ ইঞ্জিন আপনি কোন ব্রাউজারেই সেট করা পাবেন না৷ সিলেক্ট করে ব্যবহারেরও অপশন নেই৷ তবে এটার URL ব্যবহার করে ইউস করতে পারবেন৷ এটা ব্যবহারের একমাত্র পদ্ধতি৷এটা আমার পছন্দের মধ্যে অন্যতম৷
Brave
সম্প্রতি ব্রেভ ব্রাউজার তাদের নিজস্ব সার্চ ইঞ্জিন ওপেন করেছে৷ যারা ব্রেভ ব্রাউজার ব্যবহার করেন তাদের জন্য এটাই বেস্ট৷
আজকে এ পর্যন্ত-ই৷ নেক্স টাইম আবার দেখা হবে৷ প্রযুক্তি সম্পর্কিত কোন বিষয় নিয়েই ইনশাআল্লাহ৷