Sådan vises en URL Brug Regular Expressions

Programmering

C /C + + Programming

Computer Programmeringssprog

Delphi programmering

Java programmering

JavaScript Programmering

PHP /MySQL programmering

Perl programmering

Python Programming

Ruby Programming

Visual Basics Programmering

* Computer Viden >> Programmering >> Python Programming >> Content

Sådan vises en URL Brug Regular Expressions

Regular Expressions giver programmøren med stærke værktøjer til tekst analyse og manipulation. Findes overalt fra e-handel form validering til high- stakes retssager - hvor advokater søger efter kombinationer af ord i e-mails , der tilføjer op til " skyldig" - regexes hører hjemme i enhver programmør værktøjskasse. Desværre deres mystiske syntaks står som en barriere for mange brugere, der kunne drage fordel af dem. En mulig anvendelse er at scanne en tekst for Universal Resource Locators , kendt i folkemunde som web-adresser . Programmeringssproget Python udretter denne opgave på blot et par linjer kode. Ting du skal
Python 2.6 eller højere , med det IDLE integreret udviklingsmiljø
Tekstfil til test
Vis Flere Instruktioner
1

Open IDLE og skabe en teste tekstfil ved at kopiere og indsætte nogle tilfældige tekst i filen sammen med nogle webadresser . Gem filen som TestText.txt i mappen , der kommer op i save dialogboksen , så du ikke behøver at bekymre sig om stier mellem Python tolk og denne fil.
2

Gå til main IDLE vindue og skriv

>>>> import re

på Python prompt. . Dette indlæser Pythons regulære udtryk motor
3

Læs din test tekst ind Python og holde det i hukommelsen med følgende kommandoer : Hej

>>> TestText = open ( ' OCB_1.txt )

>>> rå = TestText.read ()

OCB_1.txt er navnet på min test -fil - en kopi og pasta af Ambrose Bierce er " en hændelse på Owl Creek Bridge ", med et par URL'er indsat i. I ovenstående kommandoer er tekstfilen åbnes og tildelt variablen TestText , det er så læs i hukommelsen med den tildelte variabel rå
.
4

Pre- kompilere det regulære udtryk for at fremskynde parsing processen. Dette er især nyttigt, når der beskæftiger sig med store tekstfiler . Skriv følgende kommandoer ved Python prompt : Hej

>>> pattobj = re.compile ( https ://( [- \\ w \\ . ] + ) + ( : ? \\ D +) ? ( /( [ \\ w /_ \\ . ] * ( \\ ? \\ S +) ?) ?) ? ")
5

Invoke den findall metoden ved at skrive den relevante regex kommandoen sammen med den variable henvise til teksten i hukommelsen : Hej

findallobj = pattobj.findall (rå )

Dette skaber en ny variabel , findallobj , som indeholder de mønstre fremkommer ved regex
6 .

Vise URL'en regex fundet med print kommandoen : Hej

print ( findallobj )

output ser nogenlunde sådan her : Hej

[( ' www.sjca . edu «) ( ' www.cantlers.com /index.shtml ") ]

Forrige ： Sådan Flet en Sortér i Python

næste ： Sådan Embed Python Into HTML

Relaterede artikler

·	Sådan importeres GTK Python
·	Hvordan man tegner en lige linje i Python Turtle
·	Sådan spiller en WAV fil i Python
·	Sådan formateres en streng på Python
·	Sådan Square i Python
·	Sådan kører en Python script i Windows
·	Sådan Erstat Python Kørselsvejledning
·	Funktioner med arrays & Ranges i Numerisk Python
·	Hvordan man skal fortolke en String som en boolesk i Py…
·	Sådan Konverter String til Unicode i Python

Anbefalede Artikler

·	Sådan Set en VBA End of Statement
·	Sådan Tilføj & Fratræk heltal i forskellige kolonner…
·	Sådan Konverter Strings til unsigned long Værdier
·	VBA programmering Structure
·	Sådan Turn en ekstern JavaScript Into Internal
·	Sådan bruges LINQ at finde Max i en liste
·	Forskellen i Python & Django
·	Sådan Stop alle henrettelser på Ruby
·	Hvordan til at angive værdien af en bestemt post i Acc…
·	Forskellen mellem JSF & JSP