সার্চ ইঞ্জিন কিভাবে কাজ করে ?

সার্চ ইঞ্জিন কিভাবে কাজ করে ?

আমরা ইন্টারনেট ব্যবহার করি৷ ইন্টারনেটে আমাদের প্রয়োজনীয় তথ্য অনুসন্ধান করি৷ বিভিন্ন ওয়েব সাইটে এক্সেস করি৷ এগুল সহ ইন্টারনেটের প্রায় সবগুলো কাজ সার্চিংয়ের পরেই শুরু হয়৷ কিন্ত কখনো কি ভেবে দেখেছি এই সার্চ ইঞ্জিন কি? সার্চ ইঞ্জিন কিভাবে কাজ করে এই সার্চ ইঞ্জিন? এই পোস্টে এ বিষয় নিয়েই আলোচনা হতে যাচ্ছে৷

সার্চ ইঞ্জিন কি?

Search Engine (সার্চ ইঞ্জিন) হচ্ছে এক ধরনের এলগরিদম (algorithm) যা ইন্টারনেট জগতের তথ্যগুলো নিজের সংগ্রহে রাখে এবং আপনি যখন-ই তাতে কোন কিছু সার্চ করবেন তখন সে নিজের কাছে জমা থাকা তথ্য থেকে আপনার কাছে সার্চের একটি ফলাফল বা রেজাল্ট উপস্থিত করে দেয় যা আপনি আপনার কম্পিউটার স্ক্রীনে দেখতে পান।

সার্চ ইঞ্জিন কিভাবে কাজ করে?

সার্চ ইঞ্জিন মৌলিক তিনটি প্রোগ্রাম এর মাধ্যমে কাজ করে থাকে৷

সার্চ ইঞ্জিনের তিন টি প্রোগ্রাম-

সার্চ ইঞ্জিন এর কিছু মেইন প্রোগ্রাম রয়েছে৷ যেগুলো সার্চ ইঞ্জিন সফওয়্যার সচল ভাবে কাজ করার জন্য আবশ্যক৷ যেমনটি মোবাইলের সাথে ব্যাটারি আর চার্জারের আবশ্যক৷

তা হলো-

  • Crawling (ক্রলিং) বা বুট
  • Indexing (ইনডেক্সিং)
  • Ranking (র্যঙ্কিং)

Crawling

সার্চ ইঞ্জিনের প্রথম কাজ হল- ইন্টারনেটে থাকা ওয়েব সাইট গুলো ক্রলিং বা বুট করতে থাকে৷ এটা তার প্রথম কাজ যেখানে কিছু automatic bots,বা ইন্টারনেট জগতের net of spider (মাকরসার জাল) যেগুলোকে আমরা crawler (ক্রলার) বলি, তা সম্পূর্ণ World Wide Web এর মধ্যে ঘুরে ঘুরে তথ্য (information) সংগ্রহ করে। এই crawlers (ক্রলার) গুলো অসংখ্য ওয়েবসাইট গুলোতে গিয়ে সেই ওয়েবসাইট গুলোর content এবং pages গুলোকে scan করে।

তো এই crawler গুলো, ওয়েবসাইট গুলোতে থাকা বিভিন্ন link গুলোর মাধ্যমে একটি website থেকে আরেকটি website এর মধ্যে চলে যায়। আর এভাবেই, সম্পূর্ণ world wide web এর মধ্যে “ক্রলার” গুলো ঘুরে ঘুরে তথ্য সংগ্রহ করে থাকে৷ এভাবেই “ক্রলার” গুলো ওয়েবসাইটের বিভিন্ন ধরণের তথ্য সংগ্রহ করে৷

  • যেমন- content এর মধ্যে কি কি কিওয়ার্ড রয়েছে?
  • ওয়েবপেজ এর হেড লাইন এবং সাইট টিতে কিসের বিষয়ে তথ্য রয়েছে?
  • ছবি বা ভিডিও রয়েছে কি না৷
  • ওয়েবসাইটটি সময়ে সময়ে নিয়মিত আপডেট হচ্ছে কি না?
  • Website এর মধ্যে কতটি page রয়েছে’?
  • ওয়েবসাইট এর মধ্যে কি কি internal এবং external links রয়েছে।

ইত্যাদি আরও অনেক কিছু৷ এতো গেল প্রথম কাজ৷ এরপর সার্চ ইঞ্জিন এর দ্বিতীয় কাজ হল- “Indexing“ (ইনডেক্সিং)

Indexing

Indexing হলো একটি সাধারণ প্রক্রিয়া প্রসেস৷ যেখানে সার্চ ইঞ্জিন গুলো তার ক্রলার দ্বারা ক্রল বা বুট করা ওয়েবসাইট গুলোর সম্পূর্ণ ডাটা গুলোকে তার database এর মধ্যে store করে রাখে। যার ফলে যখন কোন ইন্টারনেট ইউসার সার্চ ইঞ্জিন এর মধ্যে সার্চ করেন, তখন অনেক তাড়াতাড়ি সেই স্টোর করা database থেকে তথ্য গুলোকে সংগ্রহ করে সামনে দেওয়া হয়।

সার্চ ইঞ্জিন গুলো প্রতিদিন অগনিত ওয়েবসাইট গুলোকে বুট করতে থাকে৷ এবং তারপর index করে। এমনকি যত গুলো ওয়েবসাইট ইন্টারনেটে আছে, সেগুলোর প্রায় প্রত্যেকটি ওয়েবসাইট এই সার্চ ইঞ্জিন গুলো বুট ও index করে থাকে।

Indexing কে আরও সহজ বাংলায় বলতে গেলে বলা যায় সারা পৃথিবীর সকল ওয়েবসাইট গুলোকে সে তার ডাটাবেজে গুছিয়ে রাখে। মানে, কোন সাইটে ক্রল করে যদি দেখে সেটি নিউজ পেপার রিলেটেড সাইট তাহলে সেটা এক জায়গায় রাখে, আবার মুভি রিলেটেড সাইট গুলোকে আরেক জায়গায় গুছিয়ে রাখে। এতে করে পরবর্তীতে খুঁজে বের করতে সুবিধা হয়।

এবার আসি সার্চ ইঞ্জিনের তৃতীয় কাজ নিয়ে-

Ranking

Ranking হচ্ছে সার্চ ইঞ্জিন এর কাজ করার তৃতীয় এবং শেষ প্রক্রিয়া৷ এখানে  website ranking এর সিদ্ধান্ত নেওয়া হয়। মানে, কোন keyword যখন search engine এর দ্বারা search করা হবে, তখন, কোন কোন ওয়েবসাইট গুলোকে সার্চ করা keyword এর জন্য search result page এর কত নম্বরে দেখান হবে সেটার সিদ্ধান্ত নির্ধারন করে দেয় এই প্রোগ্রাম৷

এটি মূলত একটি এলগরিদমের মাধ্যমে নির্ধারণ করা হয় কিন্তু কোন সার্চ ইঞ্জিন তার এলগরিদম কখনই প্রকাশ করে না। তবে ধারনা করা হয় নিচের বিষয়াবলীর উপর বিবেচনা করেই সার্চ ইঞ্জিন তার র‍্যাংকিং করে থাকে।

কন্টেন্ট ইজ কিং। মানে সার্চ ইঞ্জিনের প্রথম বিবেচনা হল কন্টেন্ট। যে কন্টেন্ট যত ইনফরমেটিভ গুগল তত বেশি গুরুত্ব দেয় সেই সাইটকে।

ব্যাকলিংক হল এলগরিদমের আরেকটি ইম্পরট্যান্ট ইন্ডেক্স। ডু-ফলো ব্যাকলিংক এর মাধ্যমে র‍্যাংকিং বাড়তে পারে।

অন-পেজ এসইও আপনাকে র‍্যাংকিং বাড়াতে সাহায্য করবে।

সার্চ ইঞ্জিনের প্রয়োজনীয়তা-

সার্চ ইঞ্জিন ছাড়া খুব অল্প লোক-ই ইন্টারনেট ইউস করতে পারবে৷ বলতে গেলে প্রায় অসম্ভব৷ যারা আবার পারবে তারা হয়ত মুখস্ত কয়েকটি সাইটেই প্রবেস করতে পারবে৷ নেট জগতের বিস্তৃত তথ্য তাদের অধরাই থেকে যাবে৷ আপনি নিজেও পরীক্ষা করে দেখতে পারেন৷ আজকেই সার্চ ইঞ্জিন ছাড়া নেট ইউস যাচাই করে দেখতে পারেন৷

সার্চ ইঞ্জিন অপ্টিমাইজেশন কি?

সার্চ ইঞ্জিন অপ্টিমাইজেশনকে সংক্ষেপে বলা হয় SEO যার পূর্ণ রূপ হচ্ছে “Search Engine Optimization” (সার্চ ইঞ্জিন অপ্টিমাইজেশন)। SEO হচ্ছে কোন কি ওয়ার্ডের বিপরীতে কোন সাইট বা পেইজকে সার্চ রেজাল্টে তার বর্তমান অবস্থান থেকে ক্রমান্নয়ে উপরে দিকে নিয়ে আসার পক্রিয়া। মনে রাখবেন এটা কোন প্রোগ্রাম বা সফটওয়্যার নয় এটা একটা প্রক্রিয়া বা প্রসেস।

আমরা গুগল বা অন্য যে কোন সার্চ বারে কোন কি ওয়ার্ড লিখে সার্চ করলে ফলাফলের একেবারে উপরে যা আছে৷ তাকে SEO তে টপ মনে করা হয়৷ আশা করি এবার বুঝতে পেরেছেন৷

সার্চ ইঞ্জিনের নাম-

বর্তমানে ইন্টারনেট জুড়ে অনেক সার্চ ইঞ্জিন আছে৷ দিন যত গড়াচ্ছে সেই সাছে পাল্লা দিয়ে বাড়ছে সার্চ ইঞ্জিন৷ সেগুলো থেকে-ই কিছু সার্চ ইঞ্জিনের নাম নিচে উল্লেখ করছি৷

Google

গুগল সার্চ ইঞ্জিনের ব্যাপারে নতুন কিছু বলার নেই৷ সবাই এর সাথে পরিচিত৷ এমনকি নেট জগতের শুরু-ই হয় সাধারণত গুগল দিয়ে৷

Startpage

startpage আমার পছন্দের ইঞ্জিন গুলোর একটি৷ এটি আপনি brave, firefox, opera বা যে কোন ব্রাউজারে সিলেক্ট করে সহজেই ব্যবহর করতে পারবন৷

duckduckgo

অধিকাংশ সিকিউরিটি এক্সপার্টদের মতামত হল সিকিউরিটির জন্য duckduckgo সার্চ ইঞ্জিন ব্যবহার করা যেতে পারে৷ এটিও আপনি brave, firefox,opera বা যে কোন ব্রাউজারে সিলেক্ট করে সহজেই ব্যবহর করতে পারবন৷

yahoo

ইয়াহু বহুল ব্যবহৃত একটি সার্চ ইঞ্জিন৷ এটিও ব্রাউজার গুলোর সার্চ সেটটিংসে সাধারণত সেট করা থাকে৷

Searx

searx সার্চ ইঞ্জিন আপনি কোন ব্রাউজারেই সেট করা পাবেন না৷ সিলেক্ট করে ব্যবহারেরও অপশন নেই৷ তবে এটার URL ব্যবহার করে ইউস করতে পারবেন৷ এটা ব্যবহারের একমাত্র পদ্ধতি৷এটা আমার পছন্দের মধ্যে অন্যতম৷

Brave

সম্প্রতি ব্রেভ ব্রাউজার তাদের নিজস্ব সার্চ ইঞ্জিন ওপেন করেছে৷ যারা ব্রেভ ব্রাউজার ব্যবহার করেন তাদের জন্য এটাই বেস্ট৷

আজকে এ পর্যন্ত-ই৷ নেক্স টাইম আবার দেখা হবে৷ প্রযুক্তি সম্পর্কিত কোন বিষয় নিয়েই ইনশাআল্লাহ৷


Leave a Reply