Python er et open- source, objekt -orienteret programmeringssprog optimeret til opbygning af dynamiske web-applikationer . Ved programmering i Python, kan du blive nødt til at adskille HTML formatering fra Python kode. For eksempel kan en bruger indtaster en webside i et datafelt , at du skal isolere de HTML-tags til at gemme tekstdata . For at fjerne HTML-tags fra en streng , skal du bruge den indbyggede i Python Regular Expression modul , " Regex ." Instruktioner
1
Åbn din Python editor .
2
indlæse Regular Expression modulet ved at skrive følgende : Hej
import re
3
Definer en funktion til at fjerne alle HTML-tags. For eksempel skal du skrive følgende : Hej
def delete_html (data) :
4
Adskil HTML-kode elementer ved at bruge " re.compile "-funktionen til at udarbejde de regulære udtryk mønstre til et objekt , som du kan bruge til mønstertilpasning . Fortsat eksempel skriver dette : Hej
htmlPattern = re.compile ( r ' < . ? * >' )
I dette eksempel er " re.compile " attribut fortæller Python for at søge efter strengen " '< .. > ", som betyder begyndelsen og slutter HTML-tags.
kvalifikationskamp . " *? " fortæller Python til at matche kun tags. Uden kvalifikationskamp , vender Python strengen "
underrubrikken < /h2 >"; med kvalifikationskamp , Python returnerer " . Og
"
5
Stedfortræder en plads til alle HTML-kode ved hjælp af " sub "-funktionen . Fortsat eksempel skrive følgende : Hej
retur htmlPattern.sub ( ', data)
I dette tilfælde Python strips ud HTML-koden , og erstatter den med en tom plads . På dette tidspunkt , afhængigt af hvordan du ønsker at strukturere data kan du bruge strengen " strimmel" funktion til at fjerne tomme rum eller bruge regulære udtryk , såsom " \\ s + ", for at fjerne de ekstra mellemrum . < Br >