Qidiruv mexanizmi nima? Qidiruv tizimini optimallashtirish

Qidiruv tizimi foydalanuvchi soʻrovlari asosida maʼlumotlarni qidirish imkonini beruvchi foydalanuvchi interfeysiga ega boʻlgan butun dasturiy-apparat majmuasi. Odatda, PS har qanday foydalanuvchi o'zini qiziqtirgan ma'lumotni Internetda topishi uchun yaratilgan funktsional veb-sayt sifatida tushuniladi. Jarayonning o'zi juda oddiy va qidiruv maydoniga kalit so'z yoki iborani ("string") kiritishni va "Qidirish" tugmasini bosishni o'z ichiga oladi. Bunga javoban tizim ushbu so'rovga eng mos keladigan manba sahifalariga havolalar ro'yxatini taqdim etadi.

Bugungi kunda har xil qidiruv tizimlarining turlari:

global - butun Internet bo'ylab ma'lumot qidirish imkoniyatini yaratish;
mahalliy - mahalliy tarmoq yoki alohida saytlarda qidirish imkonini beradi.

Bundan tashqari, global tizimlar odatda quyidagilarga bo'linadi:

ixtisoslashgan - bir qator aniq parametrlarga mos keladigan ma'lumotlarni taqdim etish. Ular serverlarda, virtual do'konlarda va hokazolarda fayllarni qidirishga imkon beradi;
universal - turli xil tarkibni, ya'ni nafaqat matnni, balki tasvirlarni, audio va video fayllarni ham qidirish imkonini beradi. Bunday holda, qidiruv World Wide Web-da taqdim etilgan barcha saytlarda amalga oshiriladi. Google PS ushbu sohada etakchi hisoblanadi;
tematik - muayyan jamoalar uchun qiziqarli ma'lumotlarni qidirish uchun mo'ljallangan. Ushbu ta'rif professional va turli diniy oqimlarga tegishli bo'lishi mumkin.

Qidiruv tizimi nimadan iborat?

Quyidagilarni ta'kidlash joiz. Turli xil qidiruv tizimlari mavjud bo'lsa ham, ularning barchasi bir xil printsip asosida ishlaydi. Ular "qidiruv mexanizmi" yoki "dvigatel" deb ataladigan dasturlar to'plamiga asoslangan. Buning uchun ular ma'lumotlarni yig'adilar qidiruv botlari, ular ham "o'rgimchaklar" deb ataladi. Ularning vazifasi havolalar yordamida Internetni skanerlash va aniqlangan sahifalarni indeks fayliga kiritishdir. Ikkinchisi PS indeksi deb ataladi.

Qidiruv tizimining yana bir elementi foydalanuvchi so'rovlarini qayta ishlash uchun mo'ljallangan modulni o'z ichiga oladi. U indeksda kalit so'zlar va iboralarni qidiradi. Bu shuni anglatadiki, so'rovning o'zi allaqachon tuzilgan indeksda qayta ishlanadi va u har doim ham Internetda taqdim etilgan ma'lumotlarga to'liq mos kelmaydi.

Yetkazib berish sifatining asosiy xususiyatlari quyidagilardan iborat:

qidiruv natijalarining dolzarbligi, ya'ni so'rovga qanchalik mos kelishi;
so'rov qilingan tilning morfologiyasi va xususiyatlarini hisobga olgan holda;
qidiruv boti tomonidan ishlatiladigan algoritm bilan cheklanishi mumkin bo'lgan indeksning to'liqligi.

Foydalanuvchi qidiruv tizimining faqat kichik qismini ko'radi, bu interfeysga ega resursdir. Uning yordamida foydalanuvchi qidiruv tizimiga so'rovlar yaratadi va bu unga javoban natijalar beradi.

Ular uzoq vaqtdan beri Rossiya Internetining ajralmas qismiga aylangan. Qidiruv mexanizmlari endi ulkan va murakkab mexanizmlar bo'lib, ular nafaqat ma'lumot qidirish vositasi, balki biznes uchun jozibador sohalarni ham ifodalaydi.

Ko'pgina qidiruv tizimlari foydalanuvchilari qidiruv tizimlarining ishlash printsipi, foydalanuvchi so'rovlarini qayta ishlash sxemasi, bu tizimlar nimadan iboratligi va ular qanday ishlashi haqida hech qachon o'ylamagan (yoki bu haqda o'ylamagan, lekin javob topa olmagan) ...

Ushbu master-klass qidiruv tizimlarining qanday ishlashi haqidagi savolga javob berish uchun mo'ljallangan. Biroq, bu erda hujjatlar reytingiga ta'sir qiluvchi omillarni topa olmaysiz. Bundan tashqari, siz Yandex algoritmini batafsil tushuntirishga ishonmasligingiz kerak. Yandeks qidiruv tizimining texnologiya va rivojlanish bo'yicha direktori Ilya Segalovichning so'zlariga ko'ra, uni faqat Ilya Segalovichning o'zi "qiynoqlar ostida" tan olishi mumkin...

2. Qidiruv mexanizmi tushunchasi va vazifalari

Qidiruv tizimi - bu Internetda qidirish va foydalanuvchi so'roviga javob berish uchun mo'ljallangan dasturiy-apparat majmuasi bo'lib, matn iborasi (qidiruv so'rovi) ko'rinishida ma'lumot manbalariga havolalar ro'yxatini tegishlilik tartibida ishlab chiqaradi ( so'rovga muvofiq). Eng yirik xalqaro qidiruv tizimlari: "Google", Yahoo, MSN. Rossiya Internetida bular Yandex, Rambler, Aport.

Keling, misol sifatida Yandex qidiruv tizimidan foydalangan holda qidiruv so'rovi tushunchasini batafsil ko'rib chiqaylik. Qidiruv so'rovi foydalanuvchi tomonidan u topmoqchi bo'lgan narsaga muvofiq, iloji boricha qisqa va sodda tarzda tuzilishi kerak. Aytaylik, biz Yandex-da mashinani qanday tanlash haqida ma'lumot topmoqchimiz. Buning uchun Yandex asosiy sahifasini oching va "avtomobilni qanday tanlash kerak" qidiruv so'rovi matnini kiriting. Keyinchalik, bizning vazifamiz Internetdagi ma'lumot manbalariga bizning so'rovimiz bo'yicha taqdim etilgan havolalarni ochishdan iborat. Biroq, biz kerakli ma'lumotni topa olmasligimiz mumkin. Agar bu sodir bo'lsa, siz so'rovingizni o'zgartirishingiz kerak yoki qidiruv tizimining ma'lumotlar bazasida haqiqatan ham bizning so'rovimiz bo'yicha tegishli ma'lumotlar yo'q (bu juda "tor" so'rovlar so'ralganda sodir bo'lishi mumkin, masalan, "qanday tanlash kerak" Arxangelskdagi mashina")

Har qanday qidiruv tizimining asosiy maqsadi odamlarga ular qidirayotgan ma'lumotlarni to'liq etkazishdir. Va foydalanuvchilarni tizimga "to'g'ri" so'rovlar qilishni o'rgating, ya'ni. qidiruv tizimlarining ishlash tamoyillariga mos keladigan so'rovlar mumkin emas. Shu sababli, ishlab chiquvchilar qidiruv tizimlari uchun algoritmlar va ishlash tamoyillarini yaratadilar, bu foydalanuvchilarga o'zlari qidirayotgan ma'lumotlarni topishga imkon beradi.

Bu shuni anglatadiki, qidiruv tizimi foydalanuvchi ma'lumot qidirishda qanday fikrda bo'lsa, xuddi shunday "o'ylashi" kerak. Agar foydalanuvchi qidiruv tizimiga so'rov yuborsa, u o'ziga kerakli narsani imkon qadar tez va oson topishni xohlaydi. Natijani olgach, u bir nechta asosiy parametrlarga asoslanib, tizimning ishlashini baholaydi. U izlagan narsasini topdimi? Agar u topmagan bo'lsa, u qidirayotgan narsani topish uchun so'rovni necha marta takrorlashi kerak edi? U qanchalik muhim ma'lumotlarni topa oldi? Qidiruv tizimi so'rovni qanchalik tez ko'rib chiqdi? Qidiruv natijalari qanchalik qulay edi? Siz izlagan natija birinchimi yoki yuzinchimi? Foydali ma'lumotlar bilan birga qancha keraksiz axlat topildi? Qidiruv tizimiga kirishda kerakli ma'lumotlar, masalan, bir hafta yoki bir oy ichida topiladimi?

Ushbu savollarning barchasini javoblar bilan qondirish uchun qidiruv tizimini ishlab chiquvchilari doimiy ravishda qidiruv algoritmlari va tamoyillarini takomillashtirmoqdalar, yangi funktsiyalar va imkoniyatlarni qo'shmoqdalar va tizimning ishlashini tezlashtirish uchun har tomonlama harakat qilmoqdalar.

3. Qidiruv tizimining asosiy xarakteristikalari

Keling, qidiruv tizimlarining asosiy xususiyatlarini tavsiflaymiz:

To'liqlik
To'liqlik - qidiruv tizimining asosiy xususiyatlaridan biri bo'lib, so'rov bo'yicha topilgan hujjatlar sonining Internetdagi ushbu so'rovni qondiradigan umumiy hujjatlar soniga nisbati. Misol uchun, agar Internetda "avtomobilni qanday tanlash kerak" iborasini o'z ichiga olgan 100 ta sahifa mavjud bo'lsa va ulardan faqat 60 tasi tegishli so'rov uchun topilgan bo'lsa, qidiruvning to'liqligi 0,6 ni tashkil qiladi. Shubhasiz, qidiruv qanchalik to'liq bo'lsa, foydalanuvchi o'ziga kerak bo'lgan hujjatni Internetda umuman mavjud bo'lsa, topa olmasligi ehtimoli shunchalik kam bo'ladi.
Aniqlik
Aniqlik - qidiruv tizimining yana bir asosiy xususiyati bo'lib, u topilgan hujjatlar foydalanuvchi so'roviga qanchalik mos kelishi bilan belgilanadi. Misol uchun, agar "avtomobilni qanday tanlash kerak" so'rovida 100 ta hujjat bo'lsa, ularning 50 tasida "avtomobilni qanday tanlash kerak" iborasi mavjud, qolganlarida oddiygina ushbu so'zlar ("to'g'ri radioni qanday tanlash va uni o'rnatish" a car”), keyin qidiruvning aniqligi 50/100 (=0,5) ga teng deb hisoblanadi. Qidiruv qanchalik aniq bo'lsa, foydalanuvchi kerakli hujjatlarni tezroq topadi, ular orasida "axlat" kamroq topiladi, topilgan hujjatlar kamroq tez-tez so'rovga mos kelmaydi.
Muvofiqlik
Muvofiqlik qidiruvning bir xil darajada muhim tarkibiy qismi bo'lib, u hujjatlar Internetda e'lon qilingan paytdan boshlab qidiruv tizimining indekslari ma'lumotlar bazasiga kiritilgunga qadar o'tadigan vaqt bilan tavsiflanadi. Misol uchun, qiziqarli yangiliklar paydo bo'lgan kunning ertasiga ko'plab foydalanuvchilar tegishli so'rovlar bilan qidiruv tizimlariga murojaat qilishdi. Ob'ektiv ravishda, ushbu mavzu bo'yicha yangilik ma'lumotlari e'lon qilinganidan beri bir kundan kamroq vaqt o'tdi, ammo yirik qidiruv tizimlarining "tezkor ma'lumotlar bazasi" mavjudligi tufayli asosiy hujjatlar allaqachon indekslangan va qidirish uchun mavjud. kuniga bir necha marta yangilanadi.
Qidiruv tezligi
Qidiruv tezligi uning yuk qarshiligi bilan chambarchas bog'liq. Masalan, “Rambler Internet Holding” MChJ ma’lumotlariga ko‘ra, bugungi kunda ish vaqtida Rambler qidiruv tizimi soniyasiga 60 ga yaqin so‘rovlarni qabul qiladi. Bunday ish yuki individual so'rovni ko'rib chiqish vaqtini qisqartirishni talab qiladi. Bu erda foydalanuvchi va qidiruv tizimining manfaatlari bir-biriga to'g'ri keladi: tashrif buyuruvchi natijalarni imkon qadar tezroq olishni xohlaydi va qidiruv tizimi keyingi so'rovlarni hisoblashni sekinlashtirmaslik uchun so'rovni iloji boricha tezroq qayta ishlashi kerak.
Ko'rinish

4. Qidiruv tizimlarining qisqacha rivojlanish tarixi

Internet rivojlanishining dastlabki davrida uning foydalanuvchilari soni kam, mavjud ma'lumotlarning miqdori esa nisbatan kichik edi. Ko'pincha, faqat tadqiqotchilar Internetga kirish imkoniga ega edilar. Bu vaqtda Internetda ma'lumot qidirish vazifasi hozirgidek shoshilinch emas edi.

Tarmoq axborot resurslariga kirishni tashkil qilishning birinchi usullaridan biri mavzu bo'yicha guruhlangan resurslarga havolalar bo'lgan saytlarning ochiq kataloglarini yaratish edi. Birinchi bunday loyiha 1994 yilning bahorida ochilgan Yahoo.com sayti edi. Katalogdagi saytlar soni sezilarli darajada oshganidan so'ng, katalogdan kerakli ma'lumotlarni qidirish imkoniyati qo'shildi. To'liq ma'noda, bu hali qidiruv tizimi emas edi, chunki qidiruv maydoni barcha Internet resurslari bilan emas, balki faqat katalogdagi manbalar bilan cheklangan edi.

Bog'lanish kataloglari o'tmishda keng qo'llanilgan, ammo hozirgi vaqtda deyarli butunlay mashhurligini yo'qotgan. Hajmi bo'yicha hatto zamonaviy kataloglarda ham Internetning ahamiyatsiz qismi haqida ma'lumotlar mavjud. DMOZ tarmog'ining eng katta katalogi (Ochiq katalog loyihasi deb ham ataladi) 5 million resurs haqida ma'lumotni o'z ichiga oladi, Google qidiruv tizimining ma'lumotlar bazasi esa 8 milliarddan ortiq hujjatlardan iborat.

1995 yilda Lycos va AltaVista qidiruv tizimlari paydo bo'ldi. Ikkinchisi ko'p yillar davomida Internetda ma'lumot qidirish sohasida etakchi bo'lib kelgan.

1997 yilda Sergey Brin va Larri Peyj Stenford universitetida tadqiqot loyihasi doirasida Google qidiruv tizimini yaratdilar. Google hozirda dunyodagi eng mashhur qidiruv tizimidir!

1997 yil sentyabr oyida rus tilidagi Internetda eng mashhur bo'lgan Yandex qidiruv tizimi rasman e'lon qilindi.

Hozirgi vaqtda uchta asosiy qidiruv tizimi (xalqaro) mavjud - Google, Yahoo va o'zlarining ma'lumotlar bazalari va qidiruv algoritmlariga ega. Ko'pgina boshqa qidiruv tizimlari (ularning soni juda ko'p) ro'yxatga olingan uchta natijalardan u yoki bu shaklda foydalanadi. Masalan, AOL qidiruvi (search.aol.com) Google ma'lumotlar bazasidan, AltaVista, Lycos va AllTheWeb esa Yahoo ma'lumotlar bazasidan foydalanadi.

5. Qidiruv tizimining tarkibi va ishlash tamoyillari

Rossiyada asosiy qidiruv tizimi Yandex, undan keyin Rambler.ru, Google.ru, Aport.ru, Mail.ru. Bundan tashqari, ayni paytda Mail.ru Yandex qidiruv tizimi va ma'lumotlar bazasidan foydalanadi.

Deyarli barcha yirik qidiruv tizimlari boshqalardan farqli o'laroq, o'z tuzilishiga ega. Biroq, barcha qidiruv tizimlari uchun umumiy bo'lgan asosiy komponentlarni aniqlash mumkin. Tuzilishdagi farqlar faqat ushbu komponentlarning o'zaro ta'siri mexanizmlarini amalga oshirish shaklida bo'lishi mumkin.

Indekslash moduli

Indekslash moduli uchta yordamchi dasturdan (robotlardan) iborat:

Spider - bu veb-sahifalarni yuklab olish uchun mo'ljallangan dastur. O'rgimchak sahifani yuklab oladi va o'sha sahifadan barcha ichki havolalarni oladi. Har bir sahifaning html kodi yuklab olinadi. Robotlar sahifalarni yuklab olish uchun HTTP protokollaridan foydalanadilar. O'rgimchak quyidagicha ishlaydi. Robot serverga “get/path/document” so‘rovini va boshqa HTTP so‘rov buyruqlarini yuboradi. Bunga javoban robot xizmat ma'lumotlari va hujjatning o'zini o'z ichiga olgan matn oqimini oladi.

Sahifa URL manzili
sahifa yuklab olingan sana
Server javobi http sarlavhasi
sahifa tanasi (html kodi)

Crawler ("sayohat qiluvchi" o'rgimchak) - bu sahifadagi barcha havolalarni avtomatik ravishda kuzatib boradigan dastur. Sahifada mavjud bo'lgan barcha havolalarni tanlaydi. Uning vazifasi havolalar yoki oldindan belgilangan manzillar ro'yxati asosida o'rgimchakning keyingi qayerga borishi kerakligini aniqlashdir. Crawler, topilgan havolalar bo'yicha, qidiruv tizimiga hali noma'lum bo'lgan yangi hujjatlarni qidiradi.

Indexer (robot indexer) - o'rgimchaklar tomonidan yuklab olingan veb-sahifalarni tahlil qiluvchi dastur. Indeksator sahifani tarkibiy qismlarga ajratadi va o'zining leksik va morfologik algoritmlari yordamida ularni tahlil qiladi. Har xil sahifa elementlari tahlil qilinadi, masalan, matn, sarlavhalar, havolalar, strukturaviy va uslublar xususiyatlari, maxsus xizmat HTML teglari va boshqalar.

Shunday qilib, indekslash moduli havolalar yordamida berilgan resurslar to'plamini skanerlash, duch kelgan sahifalarni yuklab olish, olingan hujjatlardan yangi sahifalarga havolalarni ajratib olish va ushbu hujjatlarni to'liq tahlil qilish imkonini beradi.

Malumotlar bazasi

Ma'lumotlar bazasi yoki qidiruv tizimining indeksi - bu ma'lumotlarni saqlash tizimi, indekslash moduli tomonidan yuklab olingan va qayta ishlangan barcha hujjatlarning maxsus aylantirilgan parametrlari saqlanadigan ma'lumotlar massivi.

Qidiruv serveri

Qidiruv serveri butun tizimning eng muhim elementi hisoblanadi, chunki qidiruvning sifati va tezligi bevosita uning ishlashi asosidagi algoritmlarga bog'liq.

Qidiruv serveri quyidagicha ishlaydi:

Foydalanuvchidan olingan so'rov morfologik tahlildan o'tkaziladi. Ma'lumotlar bazasidagi har bir hujjatning axborot muhiti yaratiladi (keyinchalik u shaklda ko'rsatiladi, ya'ni qidiruv natijalari sahifasida so'rovga mos keladigan matn ma'lumotlari).
Qabul qilingan ma'lumotlar kirish parametrlari sifatida maxsus reyting moduliga uzatiladi. Ma'lumotlar barcha hujjatlar uchun qayta ishlanadi, buning natijasida har bir hujjat foydalanuvchi tomonidan kiritilgan so'rovning dolzarbligini va qidiruv tizimi indeksida saqlangan ushbu hujjatning turli tarkibiy qismlarini tavsiflovchi o'z reytingiga ega.
Foydalanuvchining tanloviga qarab, ushbu reyting qo'shimcha shartlar bilan sozlanishi mumkin (masalan, "kengaytirilgan qidiruv").
Keyinchalik, parcha hosil bo'ladi, ya'ni topilgan har bir hujjat uchun sarlavha, so'rovga eng mos keladigan qisqacha konspekt va hujjatning o'ziga havolasi hujjat jadvalidan chiqariladi va topilgan so'zlar ajratib ko'rsatiladi.
Olingan qidiruv natijalari foydalanuvchiga SERP (Search Engine Result Page) - qidiruv natijalari sahifasi shaklida uzatiladi.

Ko'rib turganingizdek, ushbu komponentlarning barchasi bir-biri bilan chambarchas bog'liq va o'zaro ta'sirda ishlaydi, qidiruv tizimining ishlashi uchun juda katta miqdordagi resurslarni talab qiladigan aniq, ancha murakkab mexanizmni tashkil qiladi.

6. Xulosa

Endi yuqorida aytilganlarning barchasini umumlashtiramiz.

Har qanday qidiruv tizimining asosiy maqsadi odamlarga ular qidirayotgan ma'lumotlarni to'liq etkazishdir.
Qidiruv tizimlarining asosiy xususiyatlari:
1. To'liqlik
2. Aniqlik
3. Muvofiqlik
4. Qidiruv tezligi
5. Ko'rinish
Birinchi to'liq qidiruv tizimi 1994 yilda nashr etilgan WebCrawler loyihasi edi.
Qidiruv tizimi quyidagi komponentlarni o'z ichiga oladi:
1. Indekslash moduli
2. Malumotlar bazasi
3. Qidiruv serveri

Umid qilamizki, bizning master-klassimiz sizga qidiruv tizimi tushunchasi bilan ko'proq tanishish va qidiruv tizimlarining asosiy funktsiyalari, xususiyatlari va ishlash tamoyillarini yaxshiroq tushunish imkonini beradi.

Internet ko'plab foydalanuvchilar uchun ular kiritgan so'rovlarga (savollarga) javob olishlari uchun zarurdir.

Agar qidiruv tizimlari bo'lmasa, foydalanuvchilar o'zlariga kerakli saytlarni mustaqil ravishda izlashlari, ularni eslab qolishlari va yozishlari kerak edi. Ko'p hollarda "qo'lda" mos keladigan narsani topish juda qiyin va ko'pincha imkonsiz bo'ladi.

Biz veb-saytlarda ma'lumotlarni qidirish, saqlash va saralash bo'yicha barcha muntazam ishlarni bajaramiz.

Mashhur Runet qidiruv tizimlaridan boshlaylik.

Rus tilida Internet qidiruv tizimlari

1) Mahalliy qidiruv tizimidan boshlaylik. Yandex nafaqat Rossiyada, balki Belarus va Qozog'iston, Ukraina va Turkiyada ham ishlaydi. Ingliz tilida Yandex ham mavjud.

2) Google qidiruvi bizga Amerikadan kelgan va rus tilidagi mahalliylashtirishga ega:

3) Mahalliy qidiruv tizimi Mail ru, u bir vaqtning o'zida VKontakte, Odnoklassniki ijtimoiy tarmog'ini, shuningdek My World, mashhur Answers Mail.ru va boshqa loyihalarni taqdim etadi.

4) Intellektual qidiruv tizimi

Nigma (Nigma) http://www.nigma.ru/

2017 yil 19 sentyabrdan boshlab nigma "intellektual" ishlamadi. Bu uning yaratuvchilari uchun moliyaviy manfaatdor bo'lishni to'xtatdi, ular CocCoc deb nomlangan boshqa qidiruv tizimiga o'tishdi.

5) Mashhur Rostelecom kompaniyasi Sputnik qidiruv tizimini yaratdi.

Bolalar uchun maxsus ishlab chiqilgan Sputnik nomli qidiruv tizimi bor, bu haqda men yozganman.

6) Rambler birinchi mahalliy qidiruv tizimlaridan biri edi:

Dunyoda boshqa mashhur qidiruv tizimlari mavjud:

Bing,
Yahoo!,
Baidu,
Ekoziya,

Keling, qidiruv tizimining qanday ishlashini aniqlashga harakat qilaylik, ya'ni saytlar qanday indekslanadi, indekslash natijalari tahlil qilinadi va qidiruv natijalari qanday yaratiladi. Qidiruv tizimlarining ishlash tamoyillari taxminan bir xil: Internetda ma'lumot qidirish, uni saqlash va foydalanuvchi so'rovlariga javoban etkazib berish uchun saralash. Ammo qidiruv tizimlari foydalanadigan algoritmlar juda farq qilishi mumkin. Bu algoritmlar sir saqlanadi va uni oshkor qilish taqiqlanadi.

Turli xil qidiruv tizimlarining qidiruv satrlariga bir xil so'rovni kiritish orqali siz turli xil javoblarni olishingiz mumkin. Sababi, barcha qidiruv tizimlari o'zlarining algoritmlaridan foydalanadilar.

Qidiruv tizimlarining maqsadi

Avvalo, qidiruv tizimlari tijorat tashkilotlari ekanligini bilishingiz kerak. Ularning maqsadi daromad olishdir. Siz kontekstli reklamadan, boshqa turdagi reklamalardan va kerakli saytlarni qidiruv natijalarining yuqori qismiga targ'ib qilishdan daromad olishingiz mumkin. Umuman olganda, ko'p usullar mavjud.

Bu tomoshabinlar hajmiga, ya'ni ushbu qidiruv tizimidan qancha odam foydalanishiga bog'liq. Auditoriya qanchalik katta bo'lsa, reklama shunchalik ko'p odamlarga ko'rsatiladi. Shunga ko'ra, bu reklama qimmatroq bo'ladi. Qidiruv tizimlari o‘z reklamalari orqali, shuningdek, xizmatlari sifatini, algoritmini va qidiruv qulayligini yaxshilash orqali foydalanuvchilarni jalb qilish orqali o‘z auditoriyasini oshirishi mumkin.

Bu erda eng muhim va qiyin narsa - foydalanuvchi so'rovlarining aksariyati uchun tegishli natijalarni ta'minlaydigan to'liq ishlaydigan qidiruv algoritmini ishlab chiqish.

Qidiruv tizimining ishi va webmasterlarning harakatlari

Har bir qidiruv tizimi o'z algoritmiga ega, u ma'lumotni tahlil qilish va foydalanuvchi so'roviga javoban natijalarni tuzishda juda ko'p turli xil omillarni hisobga olishi kerak:

ma'lum bir saytning yoshi,
veb-sayt domeni xususiyatlari,
saytdagi kontent sifati va uning turlari,
navigatsiya xususiyatlari va sayt tuzilishi,
qulaylik (foydalanuvchilar uchun qulaylik),
xulq-atvor omillari (qidiruv tizimi foydalanuvchi qidirayotgan narsasini saytda topganligini yoki foydalanuvchi yana qidiruv tizimiga qaytganligini aniqlashi mumkin va u erda yana o'sha so'rovga javob izlaydi)
va hokazo.

Bularning barchasi foydalanuvchi so'rovi bo'yicha natijalar iloji boricha mos bo'lishi va foydalanuvchi so'rovlarini qondirishi uchun kerak. Shu bilan birga, qidiruv tizimining algoritmlari doimiy ravishda o'zgarib turadi va takomillashtiriladi. Ular aytganidek, mukammallikning chegarasi yo'q.

Boshqa tomondan, veb-ustalar va optimallashtiruvchilar doimo o'z saytlarini targ'ib qilishning yangi usullarini ixtiro qilmoqdalar, bu har doim ham halol emas. Qidiruv mexanizmi algoritmini ishlab chiquvchilarning vazifasi nojo'ya optimallashtiruvchilarning "yomon" saytlarining TOP-da paydo bo'lishiga yo'l qo'ymaydigan o'zgartirishlar kiritishdir.

Qidiruv tizimi qanday ishlaydi?

Endi qidiruv tizimining aslida qanday ishlashi haqida gapiraylik. U kamida uch bosqichdan iborat:

skanerlash,
indekslash,
oralig'ida.

Internetdagi saytlar soni shunchaki astronomik. Va har bir sayt o'quvchilar (tirik odamlar) uchun yaratilgan ma'lumot, axborot tarkibidir.

Skanerlash

Bu yangi ma'lumotlarni to'plash, havolalarni tahlil qilish va foydalanuvchi so'rovlariga javoban unga qaytish uchun ishlatilishi mumkin bo'lgan yangi tarkibni qidirish uchun Internetda aylanib yuradigan qidiruv tizimi. Skanerlash uchun qidiruv tizimlarida qidiruv robotlari yoki o'rgimchaklar deb ataladigan maxsus robotlar mavjud.

Qidiruv robotlari veb-saytlarga avtomatik ravishda tashrif buyuradigan va ulardan ma'lumot to'playdigan dasturlardir. Tekshirish asosiy bo'lishi mumkin (robot yangi saytga birinchi marta tashrif buyuradi). Saytdan dastlabki ma'lumotlarni yig'ib, uni qidiruv tizimining ma'lumotlar bazasiga kiritgandan so'ng, robot o'z sahifalariga muntazam ravishda kirishni boshlaydi. Agar biron-bir o'zgarishlar ro'y bergan bo'lsa (yangi tarkib qo'shilgan, eski tarkib o'chirilgan), bu o'zgarishlarning barchasi qidiruv tizimi tomonidan qayd etiladi.

Qidiruv o'rgimchakning asosiy vazifasi - yangi ma'lumotni topish va uni qayta ishlashning keyingi bosqichi, ya'ni indekslash uchun qidiruv tizimiga yuborish.

Indekslash

Qidiruv tizimi ma'lumotni faqat uning ma'lumotlar bazasiga kiritilgan (u tomonidan indekslangan) saytlar orasidan qidirishi mumkin. Agar skanerlash ma'lum bir saytda mavjud bo'lgan ma'lumotlarni qidirish va to'plash jarayoni bo'lsa, indekslash bu ma'lumotlarni qidiruv tizimining ma'lumotlar bazasiga kiritish jarayonidir. Bu bosqichda qidiruv tizimi u yoki bu ma’lumotlarni o‘z ma’lumotlar bazasiga kiritish va uni qayerga, ma’lumotlar bazasining qaysi bo‘limiga kiritishni avtomatik tarzda hal qiladi. Misol uchun, Google Internetda o'z robotlari tomonidan topilgan deyarli barcha ma'lumotlarni indekslaydi, Yandex esa ko'proq tanlaydi va hamma narsani indekslamaydi.

Yangi saytlar uchun indeksatsiya bosqichi uzoq bo'lishi mumkin, shuning uchun qidiruv tizimlaridan tashrif buyuruvchilar yangi saytlarni uzoq vaqt kutishlari mumkin. Va eski, yaxshi targ'ib qilingan saytlarda paydo bo'ladigan yangi ma'lumotlar deyarli bir zumda indekslanishi mumkin va deyarli darhol "indeks" ga, ya'ni qidiruv tizimining ma'lumotlar bazasiga tushadi.

Rangli

Reyting - bu avval indekslangan va ma'lum bir qidiruv tizimining ma'lumotlar bazasiga kiritilgan ma'lumotlarni darajaga ko'ra tartibga solish, ya'ni qidiruv tizimi o'z foydalanuvchilariga birinchi navbatda qanday ma'lumotlarni ko'rsatishi va qanday ma'lumotlar joylashtirilishi " daraja” pastroq. Reytingni o'z mijoziga - foydalanuvchiga qidiruv tizimiga xizmat ko'rsatish bosqichi bilan bog'lash mumkin.

Qidiruv tizimining serverlarida olingan ma'lumotlar qayta ishlanadi va barcha turdagi so'rovlarning katta diapazoni uchun natijalar yaratiladi. Bu erda qidiruv tizimining algoritmlari o'ynaydi. Ma'lumotlar bazasiga kiritilgan barcha saytlar mavzular bo'yicha tasniflanadi va mavzular so'rovlar guruhlariga bo'linadi. Har bir so'rovlar guruhi uchun dastlabki masala tuzilishi mumkin, keyinchalik u tuzatiladi.

3.1.1-mavzu Internetda axborot izlash

Internet juda tez sur'atlar bilan o'sib bormoqda, shuning uchun yuzlab milliardlab veb-sahifalar va yuz millionlab fayllar orasidan kerakli ma'lumotlarni topish tobora qiyinlashib bormoqda. Ma'lumotni qidirish uchun yuz millionlab Internet serverlarida Web-sahifalar va fayllarning joylashuvi haqidagi doimiy yangilanadigan ma'lumotlarni o'z ichiga olgan maxsus qidiruv tizimlari qo'llaniladi.

Axborotni izlashda uchta savolga javob berish kerak: nimani qidirish kerak, ya'ni qanday ma'lumot manbalari, qayerga qarash (bu manbalarning joylashuvi) va qanday izlash (buning uchun qanday vositalardan foydalanish).

Internetda mavjud bo'lgan asosiy ma'lumot manbalari qanday? Bular WWW hujjatlari, yangiliklar guruhlari va pochta ro'yxatlaridagi maqolalar, fayl kutubxonalaridagi fayllar, tashkilotlar va odamlarning manzil ma'lumotlari kataloglari (elektron pochta, manzil, telefon), mavzuli ma'lumotlar bazalaridagi maqolalar, ensiklopediyalar.

Bu axborot manbalari qayerda joylashgan? Bular WWW, yangiliklar guruhlari, pochta ro'yxatlari va FTP serverlari kabi mashhur Internet-resurslardir.

Albatta, siz kerakli ma'lumot manbalarini qo'lda qidirishingiz, kompyuter fanlari va Internet bo'yicha ixtisoslashtirilgan jurnallardan manzillarni topishingiz va toifalarga bo'lingan manzillar bilan maxsus qog'oz kataloglardan foydalanishingiz mumkin.

Biroq, Internet kabi o'zgaruvchan makon uchun maxsus vositalardan foydalanishni o'rganish kerak, uning maqsadi axborot resurslari haqida ma'lumot to'plash va foydalanuvchilarga tezkor qidiruv xizmatini taqdim etishdir.

IRS (axborot qidirish tizimi) axborot qidirish tili va tegishli qidiruv qoidalariga asoslangan axborot manbalarining tavsifi (indeks) bilan maxsus ma'lumotlar bazasida kerakli ma'lumotlarni qidirish va tanlashni ta'minlaydigan tizim.

Har qanday axborot tizimining asosiy vazifasi foydalanuvchining axborot ehtiyojlariga mos keladigan ma'lumotlarni izlashdir. Qidiruv natijasida hech narsani yo'qotmaslik, ya'ni so'rov bilan bog'liq barcha hujjatlarni topish va ortiqcha narsa topmaslik juda muhimdir. Shu sababli, qidiruv jarayonining sifat ko'rsatkichi - dolzarblik kiritiladi.

Muvofiqlik - qidiruv natijalarining tuzilgan so'rovga muvofiqligi.

Internet qidiruv serverlarini ikki guruhga bo'lish mumkin:

– umumiy maqsadli qidiruv tizimlari;

- maxsus qidiruv tizimlari.

Umumiy maqsadli qidiruv tizimlari

Umumiy maqsadli qidiruv tizimining interfeysi qidiruv maydoni va katalog bo'limlari ro'yxatini o'z ichiga oladi. WWW uchun quyidagi qidiruv vositalari ajralib turadi: kataloglar, qidiruv tizimlari, meta-qidiruv tizimlari.

Katalog

Katalog- veb-resurslarga havolalar bilan mavzular bo'yicha tasniflangan izohlar ro'yxatiga ega qidiruv tizimi. Tasniflash odatda odamlar tomonidan amalga oshiriladi.

Katalogni qidirish juda qulay va mavzularni ketma-ket aniqlashtirish orqali amalga oshiriladi. Biroq, kataloglar mahalliy qidiruv tizimidan foydalangan holda kalit so'zlar yordamida ma'lum bir toifa yoki sahifani tezda qidirish qobiliyatini qo'llab-quvvatlaydi. Katalogning havola ma'lumotlar bazasi (indeks) odatda cheklangan hajmga ega va katalog xodimlari tomonidan qo'lda to'ldiriladi. Ba'zi kataloglar indekslarni avtomatik yangilashdan foydalanadi.

Katalogdagi qidiruv natijasi manbaga gipermatnli havola bilan hujjatlarning qisqacha tavsifi (annotatsiyasi)dan iborat ro'yxat ko'rinishida taqdim etiladi.

Mashhur katalog manzillari:

1 Xorijiy kataloglar:

a) Yahoo – www.yahoo.com;

b) Smart Look - www.looksmart.com;

c) Magellan – www.mckinley.com;

d) eiNET – www.einet.net.

2 ta ruscha katalog:

a) Aport (Internet Constellation) – www.aport.ru;

b) AU – www.au.ru;

c) Veb-roʻyxat – www.weblist.ru;

d) Salyangoz - www.ulitka.ru.

Qidiruv tizimining ma'lumotlar bazasida veb-saytlar kutubxonadagi mavzu katalogiga o'xshash ierarxik mavzu kataloglariga birlashtirilgan.

Yuqori darajadagi tematik bo'limlar, masalan: Internet, Kompyuterlar, Fan va ta'lim va boshqalar, kichik kataloglarni o'z ichiga oladi. Masalan, Internet-katalogda Qidiruv, Pochta va boshqa pastki kataloglar bo'lishi mumkin.

Katalogda ma'lumot qidirish ma'lum bir katalogni tanlashga qisqartiriladi, shundan so'ng foydalanuvchiga eng ko'p tashrif buyuriladigan va ma'lumot beruvchi veb-saytlarning Internet manzillariga havolalar ro'yxati taqdim etiladi. Har bir havola odatda izohlanadi, ya'ni u hujjat mazmuniga qisqacha sharhni o'z ichiga oladi.

Rus tilidagi Internet resurslarining eng to'liq ko'p darajali ierarxik tematik katalogi Aport qidiruv tizimida (www.aport.ru) mavjud. Katalogda veb-saytlar mazmuni va ularning geografik joylashuvi haqida batafsil ma'lumot mavjud.

Qidiruv mexanizmi

Qidiruv mexanizmi- axborot resurslari haqidagi ma'lumotlarni o'z ichiga olgan robot tomonidan yaratilgan ma'lumotlar bazasiga ega qidiruv tizimi.

Qidiruv tizimlarining o'ziga xos xususiyati shundaki, veb-sahifalar, Usenet maqolalari va boshqalar haqidagi ma'lumotlarni o'z ichiga olgan ma'lumotlar bazasi robot dasturi tomonidan yaratilgan.

Bunday tizimda qidiruv foydalanuvchi tomonidan tuzilgan, kalit so'zlar to'plamidan yoki qo'shtirnoq ichiga olingan iboradan iborat so'rov bo'yicha amalga oshiriladi. Indeks indekslash robotlari tomonidan yaratiladi va yangilanadi. Masalan, Internet qidiruv tizimlarining o'zlarini qidirish uchun siz qidiruv maydoniga "Rossiya Internet ma'lumot qidirish tizimi" kalit so'zlarini kiritishingiz mumkin.

So'rov yuborilganidan bir muncha vaqt o'tgach, qidiruv tizimi ko'rsatilgan kalit so'zlar topilgan hujjatlarning Internet manzillari ro'yxatini qaytaradi. Hujjat tavsifi ko'pincha kalit so'zlar bilan ta'kidlangan hujjat matnidan dastlabki bir nechta jumlalarni yoki parchalarni o'z ichiga oladi. Qoidaga ko'ra, hujjatni yangilash (tekshirish) sanasi ko'rsatiladi, uning kilobaytdagi hajmi ba'zi tizimlar hujjatning tilini va uning kodlanishini belgilaydi (rus tilidagi hujjatlar uchun).

Ushbu hujjatni brauzerda ko'rish uchun unga ishora qiluvchi havolani faollashtirish kifoya.

Agar kalit so'zlar noto'g'ri tanlangan bo'lsa, hujjat manzillari ro'yxati juda katta bo'lishi mumkin (o'nlab yoki hatto yuz minglab havolalarni o'z ichiga olishi mumkin). Ro'yxatni qisqartirish uchun siz qidiruv maydoniga qo'shimcha kalit so'zlarni kiritishingiz yoki qidiruv tizimi katalogidan foydalanishingiz mumkin.

Ko'pgina qidiruv tizimlari sizga topilgan hujjatlarni qidirishga imkon beradi va siz qo'shimcha shartlarni kiritish orqali so'rovingizni aniqlashtirishingiz mumkin. Agar tizimning intellekt darajasi yuqori bo'lsa, sizga o'xshash hujjatlarni qidirish xizmati taklif qilinishi mumkin. Buning uchun siz o'zingizga juda yoqqan hujjatni tanlaysiz va uni namuna sifatida tizimga yo'naltirasiz. Ammo ko'pincha bu funktsiya kutilganidek ishlamaydi. Ba'zi qidiruv tizimlari natijalarni qayta tartiblash imkonini beradi. Vaqtingizni tejash uchun qidiruv natijalarini keyinchalik oflayn o'rganish uchun mahalliy diskingizga fayl sifatida saqlashingiz mumkin.

Chet elda va Rossiyada eng mashhur qidiruv tizimlarining manzillari:

1 Xorijiy qidiruv tizimlari:

a) Google – www.google.com;

b) Alta Vista – www.altavista.com;

c) Excite – www.excite.com;

d) HotBot – www.hotbot.com;

e) Shimoliy yorug'lik - www.northernlight.com;

f) Go (Infoseek) - www.go.com (infoseek.com);

g) Lycos – www.lycos.com;

h) Tez – www.alltheweb.com.

2 ta rus qidiruv tizimlari:

a) Yandex – www.yandex.ru (yoki www.ya.ru);

b) Rambler – www.rambler.ru;

c) Aport – www.aport.ru.

Eng to'liq va kuchli qidiruv tizimlaridan biri bu Google (www.google.ru) bo'lib, uning ma'lumotlar bazasida 8 milliard veb-sahifalar saqlanadi va har oy robot dasturlari unga 5 million yangi sahifalar qo'shadi. Runet-da (Internetning Rossiya qismi) har birida 200 million hujjatni o'z ichiga olgan keng ma'lumotlar bazalarida Yandex (www.yandex.ru) va Rambler (www.rambler.ru) qidiruv tizimlari mavjud.

Meta-qidiruv mexanizmi

E'tibor bering, turli xil qidiruv tizimlari Internetdagi turli xil ma'lumotlar manbalarini tavsiflaydi. Shuning uchun siz qidiruvingizni belgilangan qidiruv tizimlaridan faqat bittasi bilan cheklay olmaysiz. Endi o'z indeksini yaratmaydigan, ammo boshqa qidiruv tizimlarining imkoniyatlaridan foydalana oladigan qidiruv vositalari bilan tanishamiz. Bular meta-qidiruv mexanizmlari (qidiruv xizmatlari) - foydalanuvchi so'rovlarini bir vaqtning o'zida bir nechta qidiruv serverlariga yuborishi mumkin bo'lgan tizimlar, so'ngra natijalarni birlashtirib, ularni havolalar bilan hujjat ko'rinishida foydalanuvchiga taqdim etadi.

Meta-qidiruv mexanizmlari o'zlarining ma'lumotlar bazasiga ega emaslar. Ular foydalanuvchi so‘rovini qabul qiladigan, sun’iy intellekt algoritmlari yordamida ushbu so‘rovni qayta ishlovchi dasturlar, so‘ngra qidiruv tizimlari. Ya'ni, ular qidiruv tizimlarining qidiruv tizimlari. Ushbu tizimlarning afzalligi ularning og'zaki so'rov bo'yicha qidirishdan ko'ra, qidiruv maqsadini sintez qilish qobiliyatidir. Bunday qidiruv natijalari foydalanuvchi uchun tushunarli va u qidirayotgan narsaga eng mos keladi. Metasearch saytlari har qanday foydalanuvchi uchun foydali bo'lishni maqsad qilgan juda ko'p imkoniyatlarni taklif qiladi. Qidiruv mezonlariga mos keladigan ma'lumot uchun Internetni doimiy ravishda tekshiradigan meta-qidiruv mexanizmlarining turli xil versiyalari mavjud.

Tizim yangi ma'lumotni topganda sizni ogohlantiradi yoki avtomatik ravishda yuklab oladi. Agar siz umumiy masalalar, sayohat va hokazolarga bag'ishlangan saytlarni topmoqchi bo'lsangiz, meta-qidiruv tizimlari sizga kerakli ma'lumotlarga tezda kirish imkonini beradi. Ular, shuningdek, telefon ma'lumotnomalari, sayohat bo'yicha qo'llanmalar va hukumat saytlari kabi aniq ma'lumotlarga ega saytlarga to'g'ridan-to'g'ri kirishni taklif qilishadi. Meta-qidiruv mexanizmlari odatda bir oz ko'proq ishlash muddatiga ega, chunki ular boshqa qidiruv tizimlariga murojaat qilishadi. Oddiy qidiruv tizimlari natija bermaganida, ularga murojaat qilish mantiqan.

Taniqli meta-qidiruv tizimlarining manzillari:

– MetaCrawler – www.metacrawler.com;

– SavvySearch – www.savvysearch.com

Salom, aziz o'quvchilar! Ekaterina Kalmykova siz bilan. Bugungi maqola qidiruv tizimi, bu nima, nima uchun kerakligi kabi tushunchaga bag'ishlanadi. Shuningdek, biz Internetdagi qidiruv tizimlarining turlarini batafsil ko'rib chiqamiz.

Agar sizda savol bo'lsa: "Nima uchun men ushbu qidiruv tizimlari haqida bilishim kerak?", men shunday javob beraman. Restoranda mazali sho'rva yeyayotganingizda, uni uyda o'zingiz qayta tayyorlashingiz uchun qanday ingredientlardan tayyorlanganligini bilishni xohlaysizmi? Axir, agar siz yakuniy natijadan, ya'ni oshning ta'midan qoniqsangiz, unda bu natijaga nima sabab bo'lganini bilish sizni qiziqtirsa kerak?

Xuddi shu narsani qidiruv tizimi (SE) bilan ishlash haqida ham aytish mumkin. Agar siz kelajakda o'z blogingizni yaratsangiz, PS qanday ishlashini bilsangiz, yordam uchun mutaxassislarga murojaat qilishingiz shart emas. Siz o'zingizning loyihangizni qidiruv tizimi uni ko'rishi va boshqa foydalanuvchilarga ko'rsatishi mumkin bo'lgan tarzda mustaqil ravishda boshqarishingiz mumkin. Axir, sizning resursingizga trafik va shunga mos ravishda sizning daromadingiz bunga bog'liq bo'ladi.

Shunday qilib, keling, boshlaylik.

Qidiruv mexanizmi nima?

Qidiruv tizimi - bu Internetdagi maxsus resurs bo'lib, foydalanuvchiga uning so'roviga muvofiq ma'lumot beradi. Ya'ni, ushbu resurs global tarmoqdagi barcha ma'lumotlarni, barcha veb-loyihalarni to'playdi va foydalanuvchidan ma'lum bir so'rov olinganda, uni, masalan, tematik blog yoki veb-saytga yo'naltirish orqali izlangan kerakli ma'lumotlarni taqdim etadi.

Shunday qilib, loyihangizni yaratganingizdan so'ng, sizning vazifangiz qidiruv natijalariga, ya'ni qidiruv tizimining "ro'yxati" yoki ma'lumotlar bazasiga kirishdir. Internetda veb-saytni ilgari surish qandaydir qidiruv tizimidan foydalanmasdan amalga oshirib bo'lmaydiganligi sababli, siz o'zingizning resursingiz sifati, uning ichki va tashqi optimallashtirilishi haqida g'amxo'rlik qilishingiz kerak bo'ladi. Buni qanday qilishni keyingi maqolalarda muhokama qilamiz. Shunday ekan, imkoniyatni boy bermang.

Ayni paytda, agar siz o'z blogingizni yaratishga qaror qilsangiz, men ushbu maqolalarni o'qishni maslahat beraman:

Deyarli har kuni yangi veb-resurslar paydo bo'lganligi sababli, qidiruv tizimining ma'lumotlar bazasi doimiy ravishda yangilanib turishi kerak. Har bir yangi yaratilgan sayt robot tomonidan indekslanishi kerak. Oddiy so'zlar bilan aytganda, qidiruv tizimining yordamchilari - robotlar - yangi resurs bilan tanishishlari va bu ma'lumotlarni qidiruv tizimining o'ziga o'tkazishlari kerak.

Xo'sh, bu erda siz robot blogingizga tashrif buyurganida, u hamma narsani yoqtirishi kerakligini taxmin qilgandirsiz. Sizning keyingi taqdiringiz shu mehmonga bog'liq bo'ladi.

Men sizga robotni loyihangizdan qanday qilib to'liq mamnun qilish kerakligini quyidagi maqolalardan birida aytib beraman. O'tkazib yubormang, men siz bilan baham ko'radigan qiziqarli va juda qiziqarli ma'lumotlar bo'ladi.

Qidiruv mexanizmlari ishlaydi

PS bilan bog'liq barcha ishlar qidiruv satriga kerakli so'rovni kiritish bilan boshlanadi. Foydalanuvchilar nimani qidirishi mumkin? Ha, hamma narsa, karamli pirog retseptidan tortib, "qanday qilib hech narsa qilmasdan ko'proq pul topish mumkin" degan abadiy savolga qadar.

Sizning resursingiz savolga javob bo'lishi uchun siz raqobatchilaringizdan oldinda bo'lishingiz kerak. Buning uchun siz o'zingizning loyihangizni targ'ib qilishga alohida e'tibor qaratishingiz kerak, u yuqori sifatli optimallashtirilgan kontentni yozish, ya'ni maqola so'rovlariga javob berish, xulq-atvor omilini yaxshilash, ya'ni o'quvchingiz resursda bo'lishdan manfaatdor, bu foydalanish qulayligini oshirish, ya'ni tashrif buyuruvchilar uchun qulaylik va boshqa ko'plab omillar. Biz hammamiz siz bilan buni qilishni o'rganamiz.

Qidiruv mexanizmi komponentlari

Va qidiruv tizimlariga, masalan, Google, manbangizni indekslashga nima yordam beradi?

Agentlar ishning asosiy qismini bajaradigan ishchilar - saytlarni indekslash va tahlil qilish.
O'rgimchaklar - bu veb-resurs sahifalarini yuklab olish va u haqida umumiy ma'lumot to'plash mumkin bo'lgan dastur.
Crawlers (crawler) - sahifalardagi barcha havolalarni qidiradigan dastur, shundan so'ng u qidiruv tizimlariga tanish bo'lmagan yangi ma'lumotlarni qidiradi.
Indexer - matn, sarlavhalar, uslub va boshqalarni tahlil qiladi.
Robotlar - kontent sahifalaringizni indekslang, shuningdek, turli havolalarni o'rganing.

Indekslash kerakli tarzda amalga oshirilishi uchun siz "robots.txt" maxsus hujjatini yaratasiz. Bu tizimga faqat kerakli sahifalarni tekshirish va ko'rmaslik kerak bo'lgan narsalarni olib tashlash imkonini beradi.

Qidiruv tizimlarining turlari

Axborot qidirish tizimlarining bir nechta variantlari mavjud:

Kataloglar. Oddiy qidiruv taqqoslash kutubxonadagi kitob javonidir. U erda hamma narsa ma'lum mavzularning pastki toifalari va toifalarida saqlanadi. Agar siz o'zingizni shunday qidiruv tizimida topsangiz, menga ishoning, u erda topilgan ma'lumotlar sizning idrokingiz uchun foydaliroq va tushunarli bo'ladi. Biz qanday umumiy sayt haqida gapirayotganimizni taxmin qila olasizmi? Albatta, foydali ma'lumotlarning butun katalogini to'plagan Vikipediya haqida.
Indekslarni qidirish. Ma'lumotlarni qidirish kalit iboralar yordamida amalga oshiriladi. Bu bir vaqtning o'zida ham qulay, ham noqulay. O'ylaymanki, meni, masalan, "Qiz o'z sinfini ko'rsatadi", qizning bosh barmog'ini qanday ko'rsatayotganini topish uchun qidiradigan odamlar tushunadilar, ammo qidiruvda unchalik yaxshi bo'lmagan narsa chiqadi. 🙂 Ushbu turdagi qidiruv ko'pchilik qidiruv tizimlarini tavsiflaydi.
Reyting tizimlari. Ular tashriflar soniga qarab mashhurligingizni aniqlaydi. Albatta, bu eng yaxshi mezon emas, chunki resursning foydaliligi va sifati har doim ham hisobga olinmaydi. Bunday tizimga misol sifatida alexa.com internet resursini keltirish mumkin.

Qidiruv serverlari ham bo'linadi umumiy va ixtisoslashgan. Umumiy qidiruv tizimlari ma'lumotlar ma'lumotlarini o'zlariga ma'lum bo'lgan barcha veb-resurslar bo'yicha tanlamasdan saralaydi. Bularga Yandex, Rambler, Google kiradi. Ixtisoslashgan - ishlatiladigan til bo'yicha tartiblash.

Qidiruv mexanizmlarini ham bo'lish mumkin mintaqaviy va global taqsimot.

Bugungi kunda barcha qidiruv tizimlari yuqori sifatli, tegishli resurslarni tanlash algoritmlarini doimiy ravishda takomillashtirmoqda.

Bir oz tarix

PS RuNet-da 1996 yilda paydo bo'lgan - bular Aport va Rambler. Bir yil o'tgach, 1997 yilda Yandex tashkil etildi va bir yil o'tib, 1998 yilda yana bir raqobatchi paydo bo'ldi - Google. Hozirda eng mashhurlari Yandex va Google.

Qaysi qidiruv tizimlari hozir eng mashhur?

Mana statistika:

Ko'rib turganingizdek, Yandex endi Rossiyada Google va Mail bilan birga eng mashhur hisoblanadi.

Shunday qilib, siz loyihangizni yaratish va targ'ib qilishda e'tibor berishingiz kerak bo'lgan eng yaxshi qidiruvlarni ko'rishingiz mumkin.

Yandex qidiruv tizimi

Ishlash printsipi quyidagicha: qidiruv satriga kerakli so'rovni kiriting, "Topish" tugmasini bosing va natijalarga qarang. Yandex sizning so'rovingizga 13 million javobni tanladi. Siz rasmlar, videolar va bozorda ham qidirishingiz mumkin (chap ustunga qarang).

Bundan tashqari, siz qidiruv hududini sozlashingiz mumkin. Buning uchun qidiruv panelidagi xoch yonidagi belgini bosing va filtr oynasida kerakli hududni tanlang.

Google qidiruvi

Google Yandex-ga o'xshash ishlaydi. Ma'lumotni turli bo'limlarda qidirishingiz mumkin: rasmlar, videolar, yangiliklar, xaritalar va boshqalar.

Agar siz "Qidiruv asboblari" ni bossangiz, mintaqani, tilni va ma'lumotni qancha vaqt davomida qidirishni tanlashingiz mumkin bo'lgan sozlamalar paneli ochiladi.

Endi siz Internetda qanday qidiruv tizimlari mavjudligini bilasiz, ularning eng mashhurlarini ham ko'rdingiz va endi ma'lumotlar bilan qurollangan holda siz qidiruv tizimlari bilan aloqa va o'zaro aloqangizni o'rnatishingiz mumkin.

Bugun uchun hammasi shu. Sizga maqola qanday yoqdi?

Hammaga hayr.

Eng so'nggi yangiliklarni o'tkazib yubormaslik uchun blogingizni yangilashingizni maslahat beraman.

Ekaterina Kalmykova