Iskanje podatkov v globalnem omrežju

Spletni iskalniki

iskanje

iskalnik je programska oprema, ki uporabnikom pomaga najti informacije, shranjene v računalniškem sistemu. Obstaja več vrst iskalnikov, ki so zasnovani za pridobivanje dokumentov, shranjenih v svetovnem spletu, znotraj korporacijskega ali lastniškega omrežja ali v osebnem računalniku. Rezultati iskanja so navadno predstavljeni v obliki seznama in se običajno imenujejo zadetki. Iskalniki pomagajo zmanjšati čas, potreben za iskanje informacij in količino informacij, ki jih moramo pregledati.

Najbolj znana oblika iskalnikov so spletni iskalniki, ki iščejo informacije na svetovnem spletu.

Rezultati iskanja so na splošno predstavljeni v obliki seznama rezultatov in predstavljeni v obliki spletnih strani. Rezultati  so lahko mešanica spletnih strani, slik, video posnetkov, infografik, člankov, raziskovalnih člankov in drugih vrst datotek. Nekateri iskalniki vsebujejo tudi podatke, ki so na voljo v podatkovnih bazah ali odprtih imenikih. Za razliko od spletnih imenikov, ki jih vzdržujejo le človeški urejevalniki, iskalniki vzdržujejo tudi informacije v realnem času z uporabo algoritma na spletnem pajku. Internetna vsebina, ki je ni mogoče iskati prek spletnega iskalnika, je na splošno opisana kot globoko splet.

Obstaja ogromno iskalnikov spletnih strani. Spisek vseh iskalcev najdemo na http://www.searchenginecolossus.com/. Vsi pa uporabljajo podobne prijeme, da si napolnijo svojo bazo strani, po katerih iščemo:

Program imenovan pajek je avtomatski program, ki raziskuje omrežje Internet in dodaja oz. odvzema s spletnih strani ustrezne informacije. Indeksni program organizira in uredi vse dobljene informacije po različnih ključih. Podatkovna baza je zbirka vseh informacij, ki jih lahko dobimo od iskalnika in je potrebna za njegovo delovanje, to je dajanje iskalnih rezultatov. Vmesnik iskalnika  je običajno spletno okno, preko katerega uporabnik zahteva iskani niz ali besedilo.

Kako delujejo iskalniki



Spletni iskalniki uporabljajo robotske aplikacije, ki samodejno preiskujejo internet, obiskujejo spletne strani in shranjujejo podatke o njihovi vsebini, ki se nato prevedejo v ogromen indeks. Vsak iskalnik uporablja lastni algoritem za ustvarjanje svojih indeksov, tako da se za vsako poizvedbo vrnejo samo pomembni rezultati. Da bi našli ustrezne spletne strani, iskalniki vsakemu dokumentu dajo uvrstitev, tj. oceno pomembnosti. Rezultati ustreznosti odražajo, kolikokrat se iskalni izraz pojavi, če se pojavi v naslovu, če se pojavi na začetku dokumenta in če so vsi iskalni izrazi blizu drug drugemu. Vendar pa je običajno kratka poletje bolj uporabna kot razvrstitev.


Iskanje več besed zoži iskanje, medtem ko iskanje manj besed razširi iskanje. Mnogi iskalniki uporabljajo orodja, kot sta AND, OR in NOT za pomoč. Nekateri iskalniki imajo prefinjene načine za zmanjšanje iskanja, da bi povečali možnosti, da uporabnik najde tisto, kar si želijo: lahko se osredotočijo na določeno vrsto spletnega mesta, združijo indeks v teme in teme ali ponudijo uporabnikom predloge po začetnem iskanju.

To so potrebni koraki za pridobivanje informacij iz iskalnika:

  1. V iskalnik vtipkamo nekaj ključnih besed
  2. Programska oprema iskalnikov hitro razvrsti milijone strani v svoji zbirki podatkov, da bi našla ujemanje s to poizvedbo;
  3. Rezultati so razvrščeni po pomembnosti.


Kako definiramo iskanje

Kako izboljšati rezultate iskanja

Spodnja slika kaže zaslon za napredno iskanje (advanced search) v iskalniku Google.


Najbolj popularni iskalniki so  trenutno: Google, Bing, Baidu, Yahoo! Yandex, Ask.com, DuckDuckGo


Namizni iskalniki


Ta orodja so namenjena iskanju informacij na uporabnikovem računalniku, vključno z zgodovino spletnega brskalnika, arhivi e-pošte, dokumentov z besedilom, zvočnimi datotekami, slikami in videi. Na voljo so različni programi za iskanje po namizju. Večina programov za iskanje po namizju so samostojne aplikacije. Izdelki za iskanje po namizju so nadomestki za programsko opremo za iskanje, ki je vključena v operacijski sistem, kar uporabnikom pomaga pri pregledovanju datotek namizja, e-poštnih sporočil, prilog in še več. Za uspešno in hitro izvedeno iskano operacijo je treba najprej ustvariti indeks ali kazalo podatkov. Tako namesto vedno ponovnega iskanja po datotekah iščemo znotraj indeksa, ki je nekakšna baza podatkov o datotekah, njihovi vsebini ali njihovih meta podatkih. Indeksiranje je torej potrebno opraviti, preden želimo začeti s iskanjem, in ga je potrebno redno ponavljati. (npr. ob zagonu računalnika, ob prijavi ali tudi večkrat dnevno).

Trenutno so najbolj razširjeni namizni iskalniki, ki se razen v  imenu proizvajalcu in zunanjem izgledu razlikujejo predvsem v podpori različnih zapisov datotek, znotraj katerih so sposobni iskati.