Strukturen og syntaks HyperText Markup langauge eller HTML, ikke kun fortæller en webbrowser hvordan du får vist en fils indhold , men også identificerer strukturelle data om selve filen . Disse tags er også uvurderlig , hvis du er en programmør søger at kode et program, der vil strippe væk bestemte dele af en HTML-fil , såsom dens header og footer . HTML Anatomi HTML bruger et simpelt system af mærket op tags til at identificere de forskellige dele af et HTML-dokument . HTML filens header er præget af " " tag , sidefoden ved tag . Et HTML- læser vil fortolke noget mellem åbningen tag og tag, der angiver sektionens tæt på, " igennem " ", som en del af den angivne afsnit. Andre tags , såsom " " svarer til andre dele af filen . Fotos Identificering sidehoveder og sidefødder Når du opretter kode til strip væk HTML sidehoveder og sidefødder , kan du ikke stole på at vide præcis , hvor længe sidehovedet eller sidefoden vil være. Mens nogle sidehoveder og sidefødder består af en enkelt linje , kunne de være meget længere. Derfor kan din kode ikke blot søge efter " / " tag derefter ' \\ n' symbol, der angiver slutningen af en linje . Når du læser HTML filens indhold ind i en tegnstreng , bliver du nødt til at identificere indekset position af den første " <" af den oprindelige tag så godt som " >" af terminalen tag . < Br > fotos Lokalisering String Positioner Begge lavt niveau sprog som C og C + + og højt niveau sprog som Python og Ruby har metoder til at hjælpe dig med at finde elementer af teksten inden for en given streng . Disse metoder vil returnere indekset position af første tegn i den tekst, du søger. Når du søger de oprindelige tags, vil dette give dig dit udgangspunkt for at fjerne tekst. Når du søger den terminal tag, så husk at det punkt, du ønsker, er enten seks ( " ") eller syv ( " " ) positioner i foran nummeret giver metoden dig. Striping Code Når du har indekset positioner for sidehoved eller sidefod segment , du vil fjerne , kan du gå om at gøre det i en af to generelle måder. Den ene er at påberåbe sig hensigtsmæssige metoder til at slette tegnene mellem den første og sidste rastpunkter for segmentet . Dette vil direkte redigere den oprindelige streng. Du kan også oprette en ny streng til at oprette to versioner af HTML filens indhold : den originale fil og en version frataget sidehoved og sidefod kode. Gør dette ved at tildele indholdet af den oprindelige streng op til den oprindelige indeks position , og så alt efter den sidste indeks position, for at den nye streng.
|