? En edderkop er et program , der logger forbindelser mellem websider. Edderkopper kan skrives i alle programmeringssprog , herunder PHP. Du kan få en edderkop program skrevet i PHP enten ved at downloade en eller skriver en. En række spider funktion biblioteker er tilgængelige for PHP. PHP
PHP er et programmeringssprog skrevet for at skabe dynamiske websider. En dynamisk webside er en hvis indhold ændringer i henhold til brugerens handlinger eller ringe parametre. Websider er skrevet i Hypertext Markup Language, eller HTML. HTML er et formatering system, men ikke et programmeringssprog . Websider er opbevaret og leveret i deres oprindelige tilstand. Denne form for fil kaldes en statisk webside . Websider skabt af PHP tage form af en HTML skabelon med programkode indsat i selve dokumentet. Når programmet kaldes , er disse programmeringsikoner henrettet, erstatter sig selv med HTML.
Edderkop
En edderkop kaldes også en web- crawler eller en Web Bot . Formålet med denne kategori af program er at dokumentere websider på World Wide Web. Programmet har brug for en webside som et udgangspunkt. Det kaldes en " seed ". Derefter følger et link i denne side til en anden side og derefter følger et link i den side til en anden side og så videre. Edderkoppen kan skrives til at logge oplysninger om hver side , det besøger , eller bare konstatere dens eksistens. Søgemaskinespiders kopierer hver side stødt ind i søgemaskinens database , hvor andre programmer udfører yderligere analyse. Selv om mange spider implementeringer har en række opgaver , lov at passere fra den ene side til den anden er den opgave , der definerer programmet som en edderkop .
Programmering Spiders
Selv om en edderkop kan skrives på ethvert sprog , Java, Perl og C # er de mest populære sprog til disse programmer . Dette er primært fordi programmører med speciale i web -programmering er bekendt med disse sprog. Python og PHP bruges også , igen, fordi disse sprog har en kompetenceudviklings pulje følger blandt de Web samfund.
Method
PHP er normalt bruges til at generere websider, derefter forelægges for anmoder webbrowsere. Webbrowsere har den aktive rolle søge et websted og anmoder om en side fra webserveren. PHP rolle er normalt statisk. En PHP -program , der fungerer som en edderkop har til at emulere webbrowsere ved at anmode websider fra webservere . Websider transporteres af Hypertext Transfer Protocol . Dette betyder ikke downloade en fil, der indeholder siden, men kopierer koden ud for siden og bærer det i brødtekst reagere på en anmodning om en side. PHP edderkop har at læse i indholdet af meddelelsen . Det betyder ikke gemme siden, men scanner indgående tekst til web links. Linket kan være i ethvert format , fordi HTML- butikker forbindelser med et tag som " ", så programmet bare har at kigge efter disse symboler og kopi af teksten , hvor " .. . "vises i dette eksempel. Søgning gennem tekst og stripping ud specifikke afsnit kaldes " parsing " i programmering sprogbrug .