Et utsnitt av HTML-kode med
syntaksmerking
HyperText Markup Language
(
HTML
,
hypertekstmarkeringssprak
) er et
markeringssprak
for formatering av
nettsider
med
hypertekst
og annen
informasjon
som kan vises i en
nettleser
. HTML benyttes til a strukturere informasjon – angi noe tekst som overskrifter, avsnitt, lister og sa videre – og kan, i en viss grad, brukes til a beskrive utseende og
semantikk
i et dokument. HTMLs
grammatiske
struktur er HTML
DTD
som ble skapt ved a gjøre bruk av
SGML
syntaks
, som er en internasjonal standard for tekstformatering (
ISO 8879
).
HTML ble opprinnelig definert i
1989
av
Tim Berners-Lee
og
Robert Caillau
. Det to utgangspunkt i
SGML
, som er en
syntaks
for tekstformatering (
ISO 8879
). Senere har HTML løsrevet seg fra SGML og siden 2010 er det dialekten
HTML5
som har dominert i bruk pa nettet. Denne vedlikeholdes av
World Wide Web Consortium
(W3C).
XHTML
er en annen HTML-dialekt som er basert pa
XML
.
Konseptet bak hypertekst stammer helt fra
middelalderen
, da det ble utviklet et system for kryssreferanser.
Hypertekst
refererer i dag ikke overraskende til lenker, men ≪hyper≫ omfatter ogsa at man kan legge inn ≪lenker≫ til filer med grafikk og bilder som nettleseren laster inn i dokumentet som om det var en integrert del. I 1940-arene skrev
Vannevar Bush
artikkelen
As We May Think
, der han beskrev et
datamaskin
-drevet hypertekstsystem han kalte
memex
. Det var starten. Utover
1960-tallet
, da datamaskiner begynte a bli vanligere, ble det gjort flere forsøk pa a lage et slikt system som var praktisk a bruke. Første gang et slikt system ble laget, slik vi kjenner det, var i
1989
, da HTML ble utviklet primært for a utveksle informasjon ved
CERN
. Systemet ble etter hvert populært rundt om pa andre universiteter, og resten er historie.
HTML utveksles mellom maskiner gjennom et sett datamaskininstruksjoner kalt
HyperText Transfer Protocol
, HTTP. HTTP kan sammenliknes med sosiale regler (hva vi skal si nar) pa samme mate som HTML kan sammenliknes med et sprak (hvordan vi sier det vi sier).
HTML-spesifikasjonen utvikles i offentlige fora ved
World Wide Web Consortium
(W3C), en medlemsorganisasjon som har som mal a jobbe for et samlet Internett. Organisasjonen bestar av representanter fra forskjellige selskaper, som alle publiserer innhold (f.eks. nettsider) eller utvikler
programvare
som brukes pa Internett, slik som
nettlesere
og
vevtjenere
. Av norske medlemmer kan
Opera Software
og
NRK
nevnes. Spesifikasjonen for HTML legges ut i flere skisser (drafts) før den endelig vedtas. Denne prosessen tar gjerne langt over et ar, og diskuteres grundig (og ofte høylytt) av alle interesserte i mellomtiden.
Et HTML-dokument bestar av en rekke
elementer
, avgrenset av
tagger
, med forskjellige betydninger. Ved a ≪tagge≫ informasjonen man vil publisere, far man et HTML-dokument som kan legges ut pa Internett (en nettside) og leses av en nettleser, som tolker de ulike elementene. Dokumentet vises sa formatert i henhold til elementenes betydning. Elementene kan ogsa hjelpe f.eks. søkemotorer med a forsta hvilken del av dokumentet som er tittelen, hva som er sitater osv.
De fleste HTML-dokumenter inneholder blant annet:
<html>
<head>
<title></title>
</head>
<body>
</body>
</html>
Det er ogsa vanlig at <head></head>-seksjonen inneholder metadata. Innholdet i slike metatagger er i hovedsak innhold som skal fanges opp av søkemotorer.
Et element apnes med en starttagg, <element>, og lukkes med en sluttagg, </element>. Man trenger ikke a lukke samtlige elementer, da de fleste nettlesere forstar hvor de fleste lukkes likevel. Det er likevel sterkt anbefalt av W3C a lukke elementene, da dette gjør arbeidet med a tolke dokumentet enklere bade for mennesker og programmer.
XHTML
-standarden sier at man
ma
lukke alle elementer. Et element kan ha forskjellige
attributter
som beskriver enkelte egenskaper ved det. Pa mange av elementene er det med attributter mulig a angi bakgrunn, farge o.l., men siden HTML-standarden i utgangspunktet ikke tok høyde for visuelle uttrykk, har man utviklet et nytt sprak for dette, kalt
Cascading Style Sheets
, som apner for mer fleksible visuelle uttrykk.
Vanlige elementer med forklaringer
[
rediger
|
rediger kilde
]
- h1
(Header 1) ? Overskriften pa dokumentet
- h2 ? h6
(Header 2 ? Header 6) ? Underoverskrifter (angir underseksjoner), oftest i mindre skrift jo høyere tall
- b
(Bold) ? Gir fet skrift, men ingen viktighetshentydning
- em
(Emphasis) ? Indikerer vektlagt tekst, vises normalt i kursiv
- i
(Italics) ? Gir kursiv tekst
- a
(Anchor) ? En lenke til en annen ressurs pa nettet (nettside, e-postadresse, nyhetsgruppe etc.)
- p
(Paragraph) ? Et avsnitt, vises som regel med en blank linje over og under
- table
(Table) ? Lager en tabell
- ul
(Unordered List) ? Punktliste
- ol
(Ordered List) ? Nummerert liste
- br
(Break) ? Linjeskift
- div
(Division) ? Som avsnitt, med linjeskift foran og bak, men normalt uten blank linje over og under, ofte brukt som skille for egne CSS-definisjoner eller med id-er som Javascript-programkode skal gjøre operasjoner pa
- span
(Span) ? Som div men normalt uten linjeskift foran og bak
- pre
(Preformatted) ? vises normalt i en skrifttype der alle bokstaver og tegn er like brede og der linjeskift i HTML-en tas hensyn til, ofte brukt i egenoppsatte "tabulerte" tabeller uten bruk av <table>
- strong
(Strong) ? Indikerer viktig tekst, vises vanligvis i fete typer
- form
(Form) ? Benyttes for skjemaer rundt input-skjemaelementer, skrivefelt, tekstredigeringsomrader, nedtrekksmenyer, knapper, avkryssningsbokser, flervalgsruter og lignende med elementene
input
,
select
og
textarea
.
Nettleserne har standardinnstillinger for hvordan disse elementene vises frem, bl.a. for
skriftstyper
, skriftsstørrelser, størrelse pa mellomrom, farger osv. Overstyring for a bestemme egne innstillinger for HTML-dokumentet skjer normalt vha
CSS
.
Dette er den versjonen av HTML som
Tim Berners-Lee
og
Robert Caillau
utviklet i
1991
. Denne versjonen inneholdt bare grunnleggende elementer for tekststrukturering. De fleste av disse er i dag utgatt eller har blitt forandret.
Dette er HTML 1.0 med noen fa ekstra elementer.
Etter HTML 2.0 kom det mange forskjellige miljøer med egne versjoner av HTML, noe som førte til vanskeligheter med a lese dokumentene med mindre man hadde de rette programmene.
HTML +
var ment a være en fornyelse og forbedring av HTML-spraket som alle kunne lese. Det ble laget støtte for tabeller, og strukturen i dokumentet ble formalisert. Det var pa dette stadiet at dokumentene begynte a se ut som beskrevet ovenfor. HTML + ble foreslatt av
Dave Ragget
i
1993
, men ble aldri tatt opp som formell standard.
Ingen av nettleserprodusentene implementerte alt av HTML 3.0 eller HTML +, sa man hoppet rett pa versjon 3.2 som bare tok opp i seg de viktigste delene av det de forskjellige produsentene allerede hadde laget, HTML 3.0 og HTML +. Mange elementer ble dermed ofret. HTML 3.2 er i all hovedsak grunnlaget for HTML slik vi kjenner det i dag.
I all hovedsak HTML 4, men med strengere syntaktiske regler (lukke alle elementer etc.). Ordet er en sammenføyning av HTML og
XML
. Grunnen til at man vil ha reglene sa strenge er blant annet at utbredelsen av sakalte
WYSIWYG
-programmer, som har gjort det lettere a lage internettsider, har ført til mer rot og flere sider som ikke følger standardene. En annen grunn er at sider som følger de rigide, men ryddige reglene blir lettere a lese for sma datamaskiner, som for eksempel
PDA
-er og
Mobiltelefoner
.
HTML5 er lansert og tok over for HTML4 i oktober 2014. Et av hovedmalene til HTML5 er a minimere behovet for a matte installere eksterne programvarer ("plugins",
webapplikasjoner
) som
Adobe Flash
,
QuickTime
og
Silverlight
da lyd, video, vektorgrafikk og interaksjon er mer støttet direkte i nettleseren. HTML5 med Javascript støtter ogsa bedre
geolokasjon
og
lokasjonsbaserte tjenester
, i tillegg til nyere apne formater som skalerbar
vektorgrafikk
.
HTML5 ble godkjent som en W3C Recommendation 28. oktober 2014.
[1]
XHTML5 skulle utvikles parallelt med HTML5 og erstatte XHTML 1.0. XHTML har vært lite brukt etter 2012.