Tekst parsing værktøjer findes for systemadministratorer og webdesignere , der har brug for at søge massive mængder af tekst til at bestemme strukturen og organiseringen af edb , system scripts eller markere -up dokumenter. Hurtig og beskidt SED og Perl scripts bygget op omkring regulære udtryk er ofte nok til simple job , men parsing komplekse XML-dokumenter kræver en mere robust værktøj, såsom Python Programming sprogs ElementTree biblioteket. Ting du skal
Python 2.5 eller højere
Vis Flere Instruktioner
1
indlede en terminal session eller , hvis du foretrækker , skal du åbne Python Integrated Development Environment , kendt som tomgang, som kan findes i Python mappen i dit C-drev (Windows) eller mappen Programmer ( Mac). Tjek din version af Python ved at skrive python- v på kommandolinjen . ElementTree er en del af Python standard biblioteket fra Python 2.5. Hvis du har Python 2.4 eller tidligere, skal du downloade den fra den vigtigste Python siden.
2
Bestem den type data kodet i et XML-dokument ved at læse roden tag . På kommandolinjen , load ElementTree og dens parse funktion med følgende kommando : Hej
> fra elementtree.ElementTree import parse
3
Find den fil, du vil parse og gøre et notat af dens sti i forhold til det færdige Python fortolkeren , eller blot flytte filen til mappen Dokumenter . Sætte en variabel til filen, læste den i hukommelsen og opdage den type data filen indeholder med følgende kommando : > tree = ElementTree ( file = filename) > elem = tree.getroot () > print elem < br >
Dette vil afsløre den type data kodet i XML-dokumentet .