Den VB.NET sprog og indeholder en HTML parsing klasse du bruger til at udtrække HTML værdier fra websider. Brug parsede data til at vurdere indhold på et websted og returnere oplysninger til en bruger eller opbevarer den udtrukne oplysninger til en database. HTML parsing klasse lader dig læse tekst indhold eller nogen værdier i formelementer som tekstbokse eller drop- down bokse. Instruktioner
1
Åbn Visual Studio software i " Microsoft. NET Framework" programgruppen. Åbn din VB projektet efter Visual Studio belastninger.
2
Højreklik på projektets navn i "Solution Explorer " panel og vælg " Egenskaber". Klik på " . NET " fanen, derefter dobbeltklikke på DLL-fil med navnet " Microsoft.mshtml . " Dette DLL indeholder klasserne til at parse HTML.
3
Føj biblioteket til VB kode fil, du ønsker at bruge at parse HTML. Kopier og indsæt følgende VB erklæring til toppen af din kode fil : Hej
Import MSHTML
4
Instantiere " HTMLDocument " klassen. Denne klasse importerer HTML-teksten du importerede fra en webside eller snor , og opstiller oplysningerne for parsing . Føj følgende kode til din parsing funktion : Hej
Dim parseHTML Som IHTMLDocument2 = Ny HTMLDocumentClass () Dim htmlData Som IHTMLElementCollection = parseHTML.body.all
5
Hent indhold fra HTML streng . For eksempel henter følgende kode værdien fra en HTML tekstboks på en webside : Hej
Dim tbData Som IHTMLInputElement = allElements.item ( " textBox1 " ) MsgBox "Dette er den data i tekstfeltet : "& tbData.Value