Introduksjon

Denne veilederen er tenkt brukt som støtteverktøy til Referansekatalog for IT-standarder i offentlig sektor, for lagring eller konvertering av multimediainnhold til åpne formater.

Innholdet er beregnet på brukere i offentlig forvaltning, som hjelp for tilrettelegging av multimedieinnhold på nettster i henhold til referansekatalogens krav til formater, åpenhet og tilgjengelighet.

Hvordan bruke veilederen?

Veilederen består av fire hoveddeler:

De fleste oppskriftene er rettet mot ansatte som primært publiserer og redigerer informasjon på offentlige nettsider (webredaktører). Resten av oppskriftene retter seg mot driftspersonell og teknikere.

Hva er en standard?

Alfabetet vårt er en standard, og betyr at vi er enige om hvilke bokstaver vi bruker når vi skriver. Vi er også (noenlunde i alle fall) enige om hvordan ord skrives og hva de betyr. Standarder for informasjon er derfor ikke noe nytt, og de er også en forutsetning for at vi kan kommunisere i det hele tatt.

Skrift på et ark og bilder trykket på papir kan brukes uten ytterligere teknologisk hjelp, og til og med en filmrull kan i alle fall forstås (om ikke nytes) uten en maskin å sette den inn i. Når informasjonen vår blir elektronisk og digital, derimot, har den ikke lenger en fysisk form, og må tolkes av datamaskiner før vi kan bruke den. Denne veilederen forteller om standarder for slik tolking.

Denne veilederen omfatter standarder for multimedieinnhold, i form av video, lyd, bilder og skalerbar grafikk.

Bilder

Bilder kan lagres i en datamaskin på to måter: Det vanligste er å dele hvert bilde i tusenvis eller millionvis av punkter, og registrere fargen i hvert av dem (kalt punktgrafikk eller bitmaps). Dersom bildet er et kart, en tegning, illustrasjon, logo eller liknende kan det derimot være en fordel å lagre linjene, kurvene og formene bildet er bygd opp av. Bilder lagret slik omtales som skalerbar grafikk eller vektorgrafikk.

Punktgrafikk

Alle nettlesere forstår og kan vise punktgrafikk, og det er punktgrafikk som lages av alle digitalkameraer, scannere og bildebehandlingsprogrammer. Andre typer bilder kan dessuten enkelt gjøres om til punktgrafikk, og det er av slike grunner de fleste bilder vi ser, lager eller publiserer er punktbasert. (De har dog en stor ulempe: Hvis vi øker størrelsen på et stykke punktgrafikk betraktelig blir bildet kornete og uklart.)

Punktgrafikk: Hvert punkt i bildet gjøres om til et tall. Bildet i denne illustrasjonen har svært lav oppløsning og få farger. Et typisk bilde fra et digitalkamera vil være langt mer detaljert.

Når du trykker utløserknappen på et digitalkamera vil det måle fargen for hvert punkt i bildet (antallet punkter avhenger av kameraet), og fargen gjøres om til et tall. Scannere, bildebehandlingsprogrammer og andre kilder til punktgrafikk opererer på samme måte.

For at tallene fra bildet skal bli nyttige for oss (som må kopiere det fra kameraet og f.eks. retusjere det og legge det på nett) må de må de organiseres på en hensiktsmessig måte, og inkludere informasjon om hvilken standard de er organisert i henhold til (for eksempel JPEG, PNG eller GIF).

Digitale bilder er ofte store, og publiseres derfor alltid i komprimert form, for å ta mindre plass. Les mer om komprimering (med eller uten tap av detaljer) under.

Skalerbar grafikk

Hvis et bilde er et kart, en figur, et diagram eller noe annet som er tegnet, er det i prinsipp best å lagre informasjonen om linjene, kurvene og flatene det består av, i stedet for brutalt dele det opp i småbiter (punkter). Da beholdes kunnskap om strukturen, og vi kan for eksempel uproblematisk øke størrelsen, eller bruke bildet på trykk. (Hvis bildet var lagret punktvis, ville vi det ganske raskt blitt kornete og stygt.)

Utsnitt av Bergens byvåpen. Venstre halvdel er lagret i et skalerbart format (SVG), mens høyre halvdel er lagret (i lavoppløsning) i et punktformat (PNG). Bare det skalerbare formatet kan forstørres uten kvalitetsproblemer.

Av forskjellige årsaker (for eksempel mangelfull støtte i nettlesere, og vanskelig integrasjon i eksisterende rutiner) er skalerbar grafikk i nettsider fortsatt lite utbredt. Punktgrafikk kan gjøres om til skalerbar form, manuelt eller automatisk, men prosessen er tungvint og resultatet kan bli langt fra perfekt.

Video

Video lagres både i kameraer, på DVD-plater, på filmruller og i datamaskiner som en sekvens av bilder tatt raskt etter hverandre (vanligvis rundt 25 pr. sekund). Ved avspilling gir det illusjonen av bevegelse.

Video lagres som en sekvens av enkeltbilder. Ved å spille dem raskt etter hverandre skapes en illusjon av bevegelse.

Som nevnt tar digitale bilder ofte stor plass. Digital film blir nødvendigvis enda større, og nettpubliseres enn så lenge alltid kraftig komprimert, med tapsbaserte metoder. (Heldigvis kan komprimering av video gjøres ytterligere mer effektiv ved å se etter likheter mellom enkeltbilder.)

Det største praktiske problemet ved å legge film inn i nettsider er svært variabel støtte for videostandarder i nettlesere. Inntil nylig var alle nettlesere avhengige av plugins for å forstå video, og det var vanskelig og komplisert å få den til å fungere på tvers av plattformer. Situasjonen er sakte i ferd med å bli bedre, blant annet på grunn av nye nettlesere med innebygd videostøtte.

Lyd

Lyd gjøres digital ved å måle styrken til lydbølgene som treffer en mikrofon (tusenvis av ganger pr. sekund). Mengden data er langt mer håndterlig enn for video, men lyd for nettbruk komprimeres vanligvis kraftig (og derfor tapsbasert) likevel.

En enkelt lydfil (eller -strøm) kan inneholde flere kanaler, for eksempel ved opptak i stereo (én kanal for venstre øre, én for høyre).

De aller fleste digitale filmer inneholder dessuten minst ett lydspor. Lyd og video kombineres ved hjelp av et innkapslingsformat (se under).

Komprimering

Multimedieinnhold tar uten videre behandling stor plass. Ved publisering på nett, der vi må ta hensyn både til begrenset lagringsplass på våre egne nettjenere, og begrenset båndbredde fram til brukerne, blir video alltid komprimert. Det samme gjelder vanligvis lyd og bilder også. Alle multimediestandardene i Referansekatalogen bruker også komprimering, tapsbasert eller tapsfritt.

Tapsbasert komprimering av multimedia er vanligst: Et program (en codec) analyserer et bilde, video eller lyd, og ser for eksempel etter mønstre som gjentas (med større eller mindre variasjoner) og detaljer som menneskelige ører eller øyne sannsynligvis ikke vil savne. Mange detaljer kan slik forenkles eller utelates, og dataene vil ta mye mindre plass (ofte bare noen prosent eller promille av originalen).

Tapsfri komprimering er flatpakking av data: Komprimeringsprogrammet vil se etter måter organisere dataene på slik at de kan pakkes ned i en fil mest mulig effektivt, og pakkes opp igjen (dekomprimeres) i nøyaktig samme stand. Framgangsmåten sparer ikke plass like effektivt, men sikrer maksimal kvalitet.

Det er svært viktig å merke seg at informasjon (og dermed kvalitet) for alltid forsvinner ved tapsbasert komprimering. Tapsbasert komprimering bør derfor begrenses eller unngås lengst mulig dersom dataene skal behandles videre. (Unngå for eksempel å bruke et lavkvalitets videoklipp fra web som del av en ny film.)

Innkapsling

Etter at bilde, film eller lyd er kodet og komprimert må de organiseres på en hensiktsmessig måte i en fil eller strøm. For film (som vanligvis har minst ett lydspor) betyr det at flere ulike datastrømmer (video og lyd) må kombineres til én. Denne prosessen kalles innkapsling.

Innkapsling: En multimediefil kan inneholde flere typer spor (f.eks. lyd, video og tekst), som alle må spilles av samtidig og synkronisert med hverandre. Innkapslingsformater brukes for å kombinere de forskjellige sporene i samme fil. Eksemplene over viser en film med Theora-video og Vorbis-lyd kapslet inn i Ogg, en film med H.264-video og AAC-lyd kapslet inn i MP4, en lydfil med Vorbis-lyd kapslet inn i Ogg, samt en lydfil bestående bare av MP3-lyd uten innkapsling.

Videostandardene gitt av Referansekatalogen pakker video (Ogg Theora eller H.264) og lyd (Ogg Vorbis eller AAC) henholdsvis inn i innkapslingsformatene Ogg og MP4.

Lydfiler kodet med Vorbis og FLAC pakkes også inn i Ogg. MP3 skiller seg ut ved å ikke pakkes ytterligere inn i det hele tatt. For bildefiler skiller sjelden mellom koding og innkapsling.

Universell utforming

HTML inneholder gode og gjennomtenkte mekanismer for å gjøre innhold tilgjengelig på tvers av både spesielle behov og brukeres egne valg av programvare og teknologi. For eksempel kan en korrekt strukturert tekst presenteres godt både på en PC-skjerm, på leselist eller med talesyntese (for svaksynte) eller på en mobiltelefon.

Noen av mekanismene er også relevante for multimedieinnhold. Et velkjent eksempel er alternativ tekst (alt="...") for bilder. På tilsvarende måte er det også mulig å supplere lyd eller video med en tekstbeskrivelse.

Foreløpig finnes det ikke etablerte, åpne standarder for slike ting som underteksting, eller synkronisering av video med andre tekst-, bilde-, lyd- eller videoelementer. Underteksting, synstolking o.l. må derfor en tid framover løses på annet vis, for eksempel programmatisk med JavaScript eller Flash, eller ved å legges inn i en video i løp av redigeringsprosessen.

Se veilederen Kognitiv tilgjengelighet av nettsider og nettsteder for mer informasjon om tilgjengelighet.

Ofte stilte spørsmål

Bør video publiseres både i MPEG-4" class="term">MPEG-4 og Ogg-format?

Publisering i begge formater gjør det mulig å dekke flere brukere. For eksempel støtter Firefox og Opera bare Ogg, og Safari (for Mac og iPhone/iPad/iPod) bare MPEG-4" class="term">MPEG-4.

Hva er best av MPEG-4" class="term">MPEG-4 og Ogg?

MPEG-4" class="term">MPEG-4 koder video mer effektivt, og vil derfor kunne gi bedre videokvalitet ved en gitt bitrate.

Hva med SMIL?

SMIL (Synchronised Multimedia Integration Language) er en eldre, XML-basert standard for bl.a. å synkronisere video, lyd, tekst og grafikk. Avspilling i nettlesere forutsetter plugins (f.eks. QuickTime eller Real), og fungerer i komplekse tilfeller ofte forholdsvis annerledes i forskjellige plugins. Bruk av SMIL bør derfor vurderes nøye.

Bakgrunnsbildet er tatt av pareeerica, distribuert under Creative Commons (Attribution 2.0 Generic).