Et praktisk eksempel på noe alle burde bry seg om

Nå som Microsoft Office 2013 er ved installert på noen maskiner er det på sin plass å skrive noe om dokumentformater. Ulikheter mellom doc, docx og odt er ikke uproblematiske – spesielt siden docx i praksis kan være tre svært ulike dokumentformat. Det jeg skal vise er ikke nødvendigvis Microsoft sin feil, men ingen kan si at de så langt har gjort en god jobb for å løse problemet. Jeg liker retningen Microsoft går i ved Office 2013, spesielt det at du som sluttbruker får valget om du vil lagre i ODF eller ett-eller-annet-Word-format, inkludert «Strict Open XML». Jeg har laget meg en rask liten test på hvordan dokumentene Word 2013 lager er leselige og redigerbare i andre tekstbehandlere. Dette er på ingen måte en utfyllende test, men den gir et bilde på hva som skjer når du prøver å åpne tekstdokumenter.

Jeg har tatt utgangspunkt i Word 2013, Word Web App (som er en del av Office 365-pakken til Microsoft Office), LibreOffice v4.0 og Google Disk.

Her test-dokumentet lagret i Words eget .docx-format…

Det skjer jo en del da, men det er bare Word 2013 som klarer å bevare all informasjon når en redigerer.

 

Så kommer samme fil, men denne gangen lagret som ODT…

Her forsvinner noe informasjon selv når Word 2013 prøver å åpne dokumentet, men det skal sies at du blir advart om at noe informasjon kan gå tapt. Pussig at Word Web App ikke kan redigere ODT-dokumentet.

 

Og til slutt lagret som Strict Open XML, som også har endelsen .docx (så du vet ikke om det er Strict Open XML eller Words eget!)…

Det var bare Word 2013 og Word Web App som klarte å åpne Strict Open XML. Så mye for Microsofts åpne og frie OOXML-format… Det er bare å holde seg til Words lukkede format eller ODTs åpne.

 

Her kommer det selvfølgelig til å bli noe rot når vi må samkjøre dokumenter på tvers av LibreOffice, Google Disk og Office 2013, men dette er noe vi får jobbe oss frem til en enighet om hvordan vi gjør i praksis. Et åpent dokumentformat alle var enige om er mer sentralt i IT-verden enn det mange tenker over. Det burde ikke være  vanskelig å få til…

Sukk… disse dokumentstandardene…

Jeg så at bloggen ble nevnt i en liten diskusjon om i hvilken grad det offentlige er pålagt å ta i mot ulike dokumentformater. Det twitteret viste til var skrevet for over et år siden og jeg ble litt usikker på om det var helt oppdatert.

Fra tidligere var det et rimelig spenstig krav i Referansekatalogen om ulike dokumentformat. Nå er det igang et «Forslag om endring av forskrift om IT-standarder i offentlig forvaltning«, der hovedideen er:

Difi mener at det kan være hensiktsmessig å endre kravene til redigerbare dokumenter ved publisering på offentlige virksomheters nettsider og ved utveksling av redigerbare dokumenter som vedlegg til e-post. Det foreslås at det ikke stilles krav til standarder for redigerbare dokumenter innen anvendelsesområdet. Samtidig foreslås det obligatoriske krav til hvilke redigerbare formater offentlig sektor plikter å ta i mot.

I praksis betyr denne endringen at de sidestiller ODF og OOXML med denne begrunnelsen:

Office Open XML ISO/IEC 29500:2011 (OOXML) er et dokumentformat opprinnelig utviklet av Microsoft med tilsvarende anvendelsesområde som ODF. Formatet er blant annet tatt i bruk i nyere versjoner av kontorstøtteprogamvaren MS Office.

Men dette er vel ikke helt korrekt (fra Wikipedia)…

Starting with Microsoft Office 2007, the Office Open XML file formats have become the default target file format of Microsoft Office, although the Strict variant of the standard is not yet fully supported. Microsoft Office 2010 provides read support for ECMA-376, read/write support for ISO/IEC 29500 Transitional, and read support for ISO/IEC 29500 Strict. Microsoft has stated that Microsoft Office 2013 will support both read and write of ISO/IEC 29500 Strict.

Det er bare «Strict» som er godkjent som en åpent dokumentstandard. Til diskusjonen om de ulike utgavene av OOXML viser til et tidligere blogginnlegg – det er fremdeles aktuelt.  Jeg synes det er litt pussig at Microsoft Office 2010 støtter lesing av et format de ikke kan skrive :-)

I praksis betyr denne endringen at en rekke offentlige kontor kommer til å publisere ting i alle forskjellige utgaver av OOXML (bortsett fra den som er godkjent! – siden Microsoft Office 2013 enda ikke er sluppet) – og at du som sluttbruker ikke vet hvilket program du skal bruke for å åpne dokumentet rett! Jeg har allerede opplevd kaos rundt .docx-filer i Randaberg kommune, alt etter om de er laget i Office 2003, 2007 eller 2010. Dette blir ikke bedre når Office 2013 kommer, selv om den sies å lage «Strict»-utgaver av OOXML.

Og for å ta et dagligdags eksempel fra Prosjekt «Nettbrett» – både kontaktlærer og jeg har opplevd marerittliknende situasjoner når elevene leverer prøver/innleveringer skrevet i forskjellige programmer på nettbrett. Alle tekstbehandlingsappene vi bruker støtter DOCX/OOXML, men ingen av dem skriver innbyrdes forståelige utgaver av OOXML! Det er til og med slik at ulike versjoner av samme app skriver ulike versjoner av OOXML. Det er ikke ukjent at noen av appene ikke klarer å lese dokumentet den selv nettopp har lagret – til stor frustrasjon (og redsel) for elevene.

Så på siste RLE-prøve fikk jeg inn dokumenter fra elevene der noen ikke ville åpnes i Office 2010, men i LibreOffice. Andre ville ikke åpnes i LibreOffice, men i Office 2010. Ingen av dem ville åpnes i appen de var laget i. Noen av dokumentene forstod Office 2010 som skrevet på arabisk, så teksten ble skrevet fra høyre til venstre (men med latinske bokstaver). Google Drive leste noen av dem. Kaotisk – og helt håpløst for de som ikke er særlig bevandret i IT-verden. Løsningen ble å lagre dokumentet på nytt i det programmet som kunne lese dem. Da gjorde både LibreOffice og Office 2010 en god jobb og jeg kunne lese dokumentene i alle programmer etterpå – bortsett fra at Office 2010 insisterte på den arabiske skriveretningen. Det gjorde ikke Google Drive og LibreOffice med akkurat de samme dokumentene.

Verden trenger et offisielt åpent dokumentformat, og OOXML er ikke en god kandidat!

Ingen flere ukeplaner i .docx!

På fredag rakk Regjeringen å få ut en revisjon av forskrift om obligatoriske IT-standarder i offentlig forvaltning. Selvfølgelig får alle god tid på seg. Vel og merke gjelder PDF-kravet (altså ikke .docx) fra 1. januar 2010 på offentlige nettsider. Vedlegg i epost o.l. gjelder fra 1. juli 2011 – altså på fredag. Multimedia-ting gjelder i staten fra 1. januar 2012 og ett år seinere for kommuner. Og for de litt tekniske av oss – det er kjekt at det offentlige også skal over på UTF8.

Ingen flere ukeplaner i .docx på skolers hjemmesider! Ingen flere som publiserer video og lyd i Microsoft sine lukkede formater! Hurra!

Slipp dokumentene fri!

Hvorfor må du slippe dokumentene dine fri?
Vi lever i en tid hvor papir i økende grad erstattes av elektroniske dokumenter. Frie dokumenter er fundamentalt for at dokumentene dine skal lenger enn programmet du bruker nå og gjør at du fritt kan velge og endre program.

Frie dokumenter og demokrati
Elektroniske dokumenter inkluderer i dag også dokumenter hos staten, som f.eks. skattepapirer, juridiske avtaler og referater fra Stortinget. Et fungerende demokrati må være sikker på at staten har full kontroll over slike dokumenter. Det samme gjelder for utveksling av informasjon mellom stat og borger. Vi må aldri være avhengig av lukkede produkter til ett firma.

Dokumentfrihet og lommeboken din
Open Document Format (ODF) og andre åpne standarder er sentrale for å kunne ha et fritt marked og fri konkurranse mellom ulike løsninger, fordi brukerne da kan velge fritt. Slik konkurranse fører også til bedre pris og funksjonalitet for alle – også deg!

Hvor kan jeg lære mer?
Besøk Document Freedom Day (DFD) sitt nettsted og lær mer om frie dokumenter og åpne standarder.

Hvordan kan jeg slippe dokumentene mine fri?
Hjelp oss øke bevisstheten om disse tingene ved å vise dem til DFD og lag en lenke til dem fra nettstedet ditt! Gjør et valg og lagre alle dokumentene dine i ODF nå. Hvis programmet ditt ikke støtter ODF… Last ned et program som gjør det!

DOCX ≠ en åpen standard

Over hele verden ser stater i økende grad betydningen av åpne IKT-standarder for å oppmuntre til mangfold og interoperabilitet, lavere kostnader og til å fremme innovasjon. At et åpent format skal brukes til offentlige dokumenter har nå blitt allment akseptert i offentlig sektor, og gjort at løsninger med åpne standard er en sentral av det offentliges IKT-strategier. Selv om dette har resultert i at Open Document Format (ODF) er blitt allment anerkjent og stadig mer akseptert av offentlig sektor, er det fortsatt forvirring og utfordringer med implementering av påståtte alternativer, som Microsofts Office Open XML (OOXML) – som til daglig omtales som DOCX-dokumenter.

Suksessen for en standard blir målt etter hvilke problemer den løser og hvilke muligheter den gir for innovasjon. Behovet for interoperabilitet, valgmuligheter og fleksibilitet blir ofte nevnt som motivasjonen for å lage og å ta i bruk åpne IKT-standarder. OOXML oppstod derimot som en reaksjon fra Microsoft for å fylle et «standard-hull» i midten av 2005. Da var det flere land som krevde åpne standarder, EU krevde større åpenhet rundt dokumentformater og flere merket risikoen for «vendor lock-in» (det å bli låst til en leverandør). Uten støtte for et åpent dokumentformat i Microsoft Office ville bruken av Office rundt omkring i verden være truet – spesielt når kravet ble en del av innkjøpsanbudet for IKT-programmer. Dette kommer også frem i beskrivelsen av hvilke behov OOXML skulle løse når det hele tiden må tas hensyn til eksisterende formater i Microsoft Office og behovet for å utvide standarden og støtte interoperabilitet. Fordi det hastet med å få på plass standarden og siden den skulle passe til en eksisterende lukket standard, ble OOXML laget uten nok arbeid for å bygge en konsensus i IKT-verden eller med nok samarbeid med konkurrenter for å tilpasse en akseptabel industristandard. Det var også en diskusjon om i hvilken grad det var nødvendig med en ny åpen dokumentstandard når det allerede eksisterte en (ODF).

Dette første til at OOXML ikke fikk nok stemmer til å bli godkjent som en standard i første avstemning i den internasjonale organisasjonen for standardisering (ISO). Mange av kommentarene var knyttet til at OOXML var for bundet opp til operativsystemet Windows. Microsoft gjorde flere endringer med standarden. Det mest sentrale var innføringen av to varianter av standarden. For å bli godkjent hadde Microsoft gått med på å flytte de delene av OOXML som var Windows-avhengige, og som derfor bare Microsoft kunne bruke, over i en «Transitional»-del av standarden. Den skulle bare brukes til å åpne gamle Microsoft Office-dokumenter. Det ble eksplisitt uttrykket at «Transitional»-delen ikke skulle brukes til å lage nye dokumenter. I en «Strict»-del ble det gjort en rekke forbedringer for å tilfredsstille ISO. Det var denne delen som skulle brukes når en laget nye dokumenter. På grunnlag av disse forbedringene ble OOXML ISO-godkjent i andre runde av avstemningene. I mars 2008 ble standarden ISO/IEC 29500 godkjent med to utgaver: «Strict» (streng) og «Transitional» (overgang).

Siden 2008 har det skjedd en del med det som skulle er OOXML og som skulle være ISO/IEC 29500. I dag er standarden fragmenter i flere ulike utgaver – og ingen av dem er støttet av Microsoft Office. Per november 2010 så det slik ut:

  • Ecma 376-varianten av OOXML er den utgaven ISO forkastet. Denne passer godt til det Office 2007 gjør når du lager dokumenter, men den mangler en del elementer. Varianten inneholder også en rekke avhengigheter til Windows. Bruken av Ecma 376 binder i praksis brukeren til Microsoft Office.
  • ISO/IEC 29500 «Strict»-varianten er den ISO godkjente til bruk for nye dokumenter. Verken Office 2007 eller Office 2010 kan lagre/skrive «Strict»-dokumenter. Microsoft har enda ikke kommet med noen offisiell uttalelse om når de fullt ut vil implementere ISO/IEC 29500 «Strict».
  • ISO/IEC 2950 «Transitional»-varianten er den som ikke skulle brukes til å lage nye dokumenter. Verken Office2007 eller Office 2010 har implementert denne utgaven fullt ut. Office 2010 lagrer dokumenter med en ikke-standardisert form av «Transitional» som inneholder en rekke proprietære/lukkende utvidelser. Disse utvidelsene er ikke sendt til ISO for godkjenning/standardisering.

For å gjøre det lett for brukerne har Microsoft kalt alle disse variantene av OOXML for .DOCX når du lagrer et dokument… :-)

At Microsoft ikke implementerer «Strict» samtidig som de utvider «Transitional» for seg selv, betyr at de ignorerer de forbedringene de måtte gjøre for å bli godkjent av ISO. Dette spriket mellom ISO-standarden og hva Microsoft faktisk gjør har fått mange til å tvile på om Microsoft faktisk ønsker å lage en ny åpen standard. Kortutgaven er at det enda ikke finnes noe program som kan lage den åpne standarden Microsoft har fått godkjent – derfor finnes den i praksis ikke.

De fleste stater som tar i bruk åpne standarder gjør dette fordi de ønsker å unngå «vendor lock-in», få lavere utgifter, økt interoperabilitet, økt tilgang til offentlige dokumenter og sikre bevaringen av disse dokumentene over lang tid. Noen, ikke alle, har også mål om å øke konkurransen og til og med å oppfordre til bruk av fri programvare. Uansett – inntil (og om ikke) den ISO-godkjente «Strict»-utgaven av OOXML er fullt implementert av Microsoft og andre leverandører, vil enhver stat som bruker OOXML være låst i en lukket standard som ikke lever opp til de målene de har satt.

Per dags dato er det bare ODF-standarden som er godkjent i Norge som en åpen standard i det offentlige… fordi det i praksis er den eneste åpne dokumentstandarden som eksisterer!

Hvorfor er åpne standarder viktig?

Om du ikke tok det av alt det som stod i innlegget om åpne standarder i det offentlige, så skal jeg ta en spissformulert kortutgave her… :-)

Om du lager et dokument i DOC har du frasagt deg en del rettigheter du kanskje trodde du hadde. Du eier dokumentet, selve filen og innholdet der, men du eier ikke måten å åpne det opp på! Filen er i seg selv uleselig og du trenger et program for å «åpne det opp» til noe som er leselig. Retten til å «åpne det opp» eier Microsoft. Hvis de bestemte seg for at du måtte betale dem kr. 10,- hver gang du åpnet et dokument i Word, så måtte du gjort det for å få tilgang til den praktiske informasjonen du har lagret i dokumentet. Jeg tror ikke Microsoft noen gang kommer til å gjøre det, nettopp fordi de da ville miste hele markedet til et åpent format – umiddelbart.

Fraunhofer IIS, som eier MP3-formatet, har i praksis gjort det Microsoft ikke har gjort. De tar betalt hver gang noen selger ett program som spiller av eller lager MP3-filer. Se igjennom listen for hva de vil ha betalt for de ulike tillatelsene. De tjener mye penger på dette! Det er kanskje ikke helt uten grunn at Spotify gikk fra MP3 over til OGG, som er en åpen standard. Da slapp de å betale 2% av overskuddet sitt til Fraunhofer.

Poenget er at vi her ikke snakker om retten til selve innholdet – du kan godt ha skrevet romanen eller laget musikken selv. Det er snakk om retten til å få tilgang til innholdet, uten å spørre noen om lov (f.eks. mot betaling). Det hjelper ikke om informasjonen/oppskriften til å helbrede kreft lå i et dokument – om du ikke fikk lov til å åpne det!

Derfor må all informasjon lagres i et format som aldri vil kunne sperres av noen… noensinne!

Åpne standarder i det offentlige

Referansekatalogen V2 inneholder de standardene regjeringen vil at det offentlige skal benytte seg av når de utveksler digital informasjon. Det vil si at dokumenter, lyd, bilde, film osv. skal være lagret, eller tilgjengelig, i et bestemt format/en bestemt standard når en skal samhandle digitalt i eller med det offentlige. Målet var at «å bidra til at offentlig sektor tar i bruk IT-standarder, fortrinnsvis åpne standarder, på en måte som er til beste for brukerne av offentlige e-tjenester, for offentlig sektor selv og for samfunnet som helhet.» (min utheving).

Tenk litt på dette sitatet fra regjeringens Referansekatalog v2:

Referansekatalogen for IT-standarder i offentlig sektor er etablert for å bedre samhandlingen mellom IT-systemer i offentlig sektor, for å redusere bindinger til enkeltleverandører og for å bidra til likebehandling og inkludering av alle innbyggere, uavhengig av hva slags programvare eller programvareplattform hver enkelt benytter.

Dette er en positiv begrunnelse, så tenk deg nå den «negative» utgaven av denne begrunnelsen – hva som skjer om vi ikke går for åpne standarder i det offentlige:

Referansekatalogen for IT-standarder i offentlig sektor er etablert for å unngå at IT-systemer i offentlig sektor ikke kan samhandle, forhindre at det offentlige låser seg til enkeltleverandører og for å hindre forskjellbehandling og ekskludering av alle innbyggere, fordi de blir bundet opp til en bestemt type programvare eller programvareplattform som det offentlig måtte benytte seg av.

Jeg regner med at noen nå trenger en forklaring på hva en åpen standard er kontra en lukket standard. Definisjonen av en åpen standard er ikke satt i norsk lov, så det finnes flere måter å forstå den på, men de fleste kan vel gå for noe i denne retningen: en åpen standard er en beskrivelse/spesifikasjon som er fritt tilgjengelig, som ikke legger begrensninger på hvordan den brukes og som har blitt vedtatt gjennom en prosess hvor alle interesserte har kunnet øve innflytelse. Det motsatte, en lukket eller proprietær standard, er når beskrivelsen ikke er fritt tilgjengelig eller det er kraftige begrensninger i hvordan den kan brukes (eller hvem som kan bruke den).

Du skal få to eksempel på lukkede/proprietære standarder som er lukket på hver sin måte. Vi begynner med Microsoft Words «gamle» filformat DOC. Microsoft har ikke frigitt informasjon om hvordan du kan lage eller lese et DOC-dokument. Det betyr i praksis at det bare er Microsoft som kan lage programmer som leser og skriver DOC-dokumenter. Du må altså kjøpe Microsoft Office for å kunne lage og lese disse dokumentene. Hvis du nå innvender at OpenOffice kan lese og skrive DOC-dokumenter, så har du helt rett. Men dette kan OpenOffice gjøre fordi noen har satt seg ned og brukt «reverse engineering» for å dette til. De har rett og slett prøvet og feilet seg frem til hvordan Microsoft Word lager og leser DOC-dokumenter. De har ikke fått denne informasjonen fra Microsoft. Hvis Microsoft gjør endringer i hvordan Word leser og skriver dokumenter, må noen andre prøve å finne ut hva de har gjort for at du skal kunne bruke et annet program enn Word for å lese dokumentet.

Det andre eksempelet er en MP3-fil. Visste du at et program som spiller av eller lager MP3-filer aldri kan være gratis (da er det laget ulovlig)? Antakeligvis ikke. MP3-standarden, altså hvordan du lager og spiller av filer som er lagret med MP3-formatet, er tilgjengelig for alle som vil se den. Den er ikke hemmelig, slik DOC-formatet er, men standarden er patentert. Dvs. at noen eier «oppfinnelsen» MP3 (det å komprimere lyd på en spesiell måte) og vil ha betalt hvis noen skal benytte seg av det.

I praksis sier regjeringen med Referansekatalogen at du ikke må ha kjøpt Microsoft Windows for å kjøre Microsoft Word for å kunne åpne dokumentet du vil hente fra NAV. Informasjonen fra NAV skal være tilgjengelig i et åpent format slik at du kan lese den uavhengig om du kjører linux, MacOS eller Windows… eller noe annet.

Kommunene har også fulgt dette opp i eKommune 2012, og sier at…

  • Alle kommuner og fylkeskommuner skal implementere gjeldende krav til bruk av åpne standarder.
  • Kommuner og fylkeskommuner skal innarbeide krav til åpne standarder i sine eKommune-strategier.

Alt som skal ut på offentlige nettsider skal altså være enten i PDF- eller ODF-format, så kan en legge ved et DOC- eller DOCX-dokument i tillegg om de ønsker det.

Det kan godt hende at noen Microsoft-vennlige sjeler nå kommenterer at Microsoft Office støtter åpne dokumentformat. Microsoft har implementert en viss støtte for ODF-formatet i de siste utgavene av Microsoft Office, men denne støtten er blitt kritisert av organisasjonen som har ansvar for ODF-standarden som for dårlig – og nesten som et forsøk på å ødelegge standarden. Dette mener noen Microsoft gjør fordi de har laget en ny åpen dokumentstandard, som i praksis dukket opp som en konkurrent til det allerede eksisterende åpne formatet. Av forskjellige grunner, som jeg skal skrive et eget innlegg om, kommenterer Referansekatalogen denne standarden slik:

Dokumentformatet OOXML ble publisert av ISO 18. november 2008. Den er besluttet fortsatt å være under observasjon.

…og OOXML er da ikke et dokumentformat en har anledning til å bruke som et åpent format i offentligheten.