Bagaimana Mesin Pencari Bekerja - Web crawler - xgangsaID

Bagaimana Mesin Pencari Bekerja - Web crawler

 

Web crawler
Ini adalah mesin pencari yang akhirnya membawa website Anda untuk pemberitahuan dari pengunjung. Oleh karena itu lebih baik untuk mengetahui bagaimana mesin pencari ini benar-benar bekerja dan bagaimana mereka menyajikan informasi kepada pengunjung memulai pencarian.

Pada dasarnya ada dua jenis mesin pencari. Yang pertama adalah dengan robot disebut crawler atau spider.

Mesin pencari menggunakan spider ke website indeks. Ketika Anda mengirimkan halaman website Anda ke mesin pencari dengan melengkapi halaman pengiriman diperlukan mereka, mesin pencari spider akan mengindeks seluruh situs Anda. A 'laba-laba' adalah sebuah program otomatis yang dijalankan oleh sistem mesin pencari. Spider mengunjungi situs web, membaca konten pada situs sebenarnya, Meta tag situs dan juga mengikuti link yang menghubungkan situs. Laba-laba kemudian kembali semua informasi yang kembali ke pusat penyimpanan, di mana data diindeks. Ini akan mengunjungi setiap link yang Anda miliki di website Anda dan indeks situs tersebut juga. Beberapa laba-laba akan hanya indeks sejumlah halaman di situs Anda, jadi jangan membuat situs dengan 500 halaman!

spider secara berkala akan kembali ke situs untuk memeriksa setiap informasi yang sudah berubah. Frekuensi yang ini terjadi ditentukan oleh moderator dari mesin pencari.

spider adalah hampir seperti buku mana berisi daftar isi, konten yang sebenarnya dan link dan referensi bagi semua situs yang ditemukan selama pencarian, dan itu mungkin indeks hingga satu juta halaman sehari.

Contoh: Excite, Lycos, AltaVista dan Google.

Ketika Anda meminta mesin pencari untuk mencari informasi, sebenarnya mencari melalui indeks yang telah dibuat dan tidak benar-benar mencari Web. Mesin pencari yang berbeda menghasilkan peringkat yang berbeda karena tidak setiap mesin pencari menggunakan algoritma yang sama untuk mencari melalui indeks.

Salah satu hal bahwa sebuah mesin pencari algoritma scan adalah frekuensi dan lokasi kata kunci pada halaman web, tetapi juga dapat mendeteksi buatan isian kata kunci atau spamdexing. Kemudian algoritma menganalisis cara yang halaman yang memiliki pranala ke halaman lain di Web. Dengan memeriksa bagaimana halaman link ke satu sama lain, mesin berdua bisa menentukan apa halaman sekitar, jika kata kunci dari halaman yang terhubung mirip dengan kata kunci pada halaman asli.
misalnya saja kata kunci minuman berenergi aman tidak berbahaya semoga bisa terindeks google.co.id


No comments:

Post a Comment