Sådan Skrab & Parse Adresser

Programmering

C /C + + Programming

Computer Programmeringssprog

Delphi programmering

Java programmering

JavaScript Programmering

PHP /MySQL programmering

Perl programmering

Python Programming

Ruby Programming

Visual Basics Programmering

* Computer Viden >> Programmering >> Python Programming >> Content

Sådan Skrab & Parse Adresser

Skrabning og parsing er to nært beslægtede website data - mining praksis. Den mere generelle , parsing , henviser til at nedbryde data i sine bestanddele. Når din middle- school engelsk lærer bad dig om at diagram sætninger , var du parsing ord disse straffe for deres dele af talen . Skrabning mere specifikt refererer til parsing websider for bestemte typer af data , i dette tilfælde , adresser. Programmeringssproget Python og " BeautifulSoup " udvidelse tillader brugeren at skrabe og parse hjemmesider i et par linjer kode. Ting du skal
Python 2.6 eller højere
BeautifulSoup 3,2
Vis Flere Instruktioner
1

Installer BeautifulSoup ved at downloade den nyeste version fra mærkværdige software og untar /unzip filen. Åbn et terminalvindue og skriv følgende kommando: My- iMac: ~ mig $ python Downloads/BeautifulSoup-3.2.0/python setup.py installere

Dette fortæller Python tolk til at køre BeautifulSoup install script , der kan findes i BeautfulSoup mappe , hvilket er i mappen Downloads
2

Type Python ved prompten , tast retur og import BeautifulSoup : . My- iMac: ~ mig $ python >>> import BeautifulSoup
3

Kør følgende script til at åbne en webside og udskrive Universal Resource Locators ( web-adresser ), som du kan finde i en side : >>> import urllib2 >> ; > page = urllib2.urlopen ( " http://www.THE URL DU VIL at skrabe HERE" ) >>> suppe = BeautifulSoup (side ) >>> soup.findAll ( 'a ' ) >>> print soup.strip () >>> printThis script vil åbne en webside, parse html , søge efter tagget hvor webadresser er indlejret , fjerne tags og lade teksten.

Forrige ： Sådan får Python at få et billede Output

næste ： Sådan gør du: Metode til Pylon Target Montering

Relaterede artikler

·	Hvad er Python EXE
·	Sådan Test for Intersect af to linjer i Python
·	Sådan eksporteres billeder til Python
·	Små bogstaver String Sammenligninger i Python
·	Ydre Funktion og Omfang i Python
·	Python Load Funktioner
·	Python Lambda Tutorial
·	Sådan Loop Through Alle Ejendomme på en Python Object…
·	Liste over Pythonmoduler
·	Sådan Load et Python script til en IDLE Shell

Anbefalede Artikler

·	Sådan kopieres en fil i JSP
·	Sådan oprettes en dobbeltsidet Pyramid i Java til Brug…
·	Python Print Funktioner
·	Sådan opgraderer Java til 1.4.2-03
·	Sådan Luk Embedded formularer i Symfony
·	Sådan center - Begrund String Output i Java
·	Sådan slettes Sheets Uden bekræftelse med VBA
·	Hvordan man opbygger 32- bit Linux Programmer på 64- b…
·	Hvordan man laver en labyrint i Java
·	Sådan Konverter og afkode HTML til en String på iPhon…