Den " jsoup " Java -bibliotek indeholder en funktion , der fratager en Java streng af alle HTML -tags og konverterer indholdet til almindelig tekst. Dette bibliotek er nyttig, når du ønsker at downloade hjemmesider og hjemmeside HTML og evaluere det kun teksten i dit program. Indholdet er tilbage , så du kan gemme indholdet til en database eller gemme indholdet til en fil på den lokale server. Instruktioner
1
Højreklik på Java -fil, du vil redigere, og vælg " Åbn med ". Klik på din Java-applet editor i listen over programmer for at åbne koden.
< Br > 2.
Find HTML streng du ønsker at parse og skabe almindelig tekst variabel. Følgende kode opretter en variabel til at gemme den parset HTML-indhold : Hej
Document alm = null ;
3
Parse HTML til almindelig tekst og gemme resultatet til " , alm " variabel. Følgende kode viser, hvordan du parse HTML tags:
alm = Jsoup.parse ( html ),
Erstat " html " med dit eget HTML string
.