Blog: Standarder

Har jeg nogen sinde nævnt at jeg bliver gammel og træt hver gang jeg skal implementere en eller anden standard ?

Som jeg fortalte sidder jeg og roder med WARC filformatet, forgyldt i ISO 28500.

Her defineres forskellige headere, bla:

Senere, i Annex C gives nogle eksempler og her finder man:

Bemærk hvorledes WARC-Record-ID har uri’en wrappet i <…> mens WARC-Target-URI ikke er.

Gældende standard for URI’er er RFC3986 der i Annex C bla. skriver:

Appendix C. Delimiting a URI in Context

URIs are often transmitted through formats that do not provide a
clear context for their interpretation. For example, there are many
occasions when a URI is included in plain text; examples include text
sent in email, USENET news, and on printed paper. In such cases, it
is important to be able to delimit the URI from the rest of the text,
and in particular from punctuation marks that might be mistaken for
part of the URI.

In practice, URIs are delimited in a variety of ways, but usually
within double-quotes “http://example.com/“, angle brackets
, or just by using whitespace:

  http://example.com/

These wrappers do not form part of the URI.

[...]

At pakke uri’erne i <…> er altså hverken krævet eller tilladt af ISO 28500.

Kigger man efter eksempler på nettet finder man at alle wrapper WARC-Record-ID, formodentlig fordi eksemplerne i standarden gjorde det, mens andre felter, som f.eks WARC-Target-URI normalt ikkw wrappes i <…>.

Det følger indlysende at man bliver nødt til at acceptere <…> når man læser WARC filer, men skal man også bruge dem når man skriver WARC filer ?

Nogen der har et gæt på hvor meget WARC software der forventer at finde <…> ?

phk

PS: Beklager funky syntax-highlighting, vi mangler en “kode-stil” der bare lader være…

Posted in computer.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>