Et praktisk eksempel på noe alle burde bry seg om

Nå som Microsoft Office 2013 er ved installert på noen maskiner er det på sin plass å skrive noe om dokumentformater. Ulikheter mellom doc, docx og odt er ikke uproblematiske – spesielt siden docx i praksis kan være tre svært ulike dokumentformat. Det jeg skal vise er ikke nødvendigvis Microsoft sin feil, men ingen kan si at de så langt har gjort en god jobb for å løse problemet. Jeg liker retningen Microsoft går i ved Office 2013, spesielt det at du som sluttbruker får valget om du vil lagre i ODF eller ett-eller-annet-Word-format, inkludert «Strict Open XML». Jeg har laget meg en rask liten test på hvordan dokumentene Word 2013 lager er leselige og redigerbare i andre tekstbehandlere. Dette er på ingen måte en utfyllende test, men den gir et bilde på hva som skjer når du prøver å åpne tekstdokumenter.

Jeg har tatt utgangspunkt i Word 2013, Word Web App (som er en del av Office 365-pakken til Microsoft Office), LibreOffice v4.0 og Google Disk.

Her test-dokumentet lagret i Words eget .docx-format…

Det skjer jo en del da, men det er bare Word 2013 som klarer å bevare all informasjon når en redigerer.

 

Så kommer samme fil, men denne gangen lagret som ODT…

Her forsvinner noe informasjon selv når Word 2013 prøver å åpne dokumentet, men det skal sies at du blir advart om at noe informasjon kan gå tapt. Pussig at Word Web App ikke kan redigere ODT-dokumentet.

 

Og til slutt lagret som Strict Open XML, som også har endelsen .docx (så du vet ikke om det er Strict Open XML eller Words eget!)…

Det var bare Word 2013 og Word Web App som klarte å åpne Strict Open XML. Så mye for Microsofts åpne og frie OOXML-format… Det er bare å holde seg til Words lukkede format eller ODTs åpne.

 

Her kommer det selvfølgelig til å bli noe rot når vi må samkjøre dokumenter på tvers av LibreOffice, Google Disk og Office 2013, men dette er noe vi får jobbe oss frem til en enighet om hvordan vi gjør i praksis. Et åpent dokumentformat alle var enige om er mer sentralt i IT-verden enn det mange tenker over. Det burde ikke være  vanskelig å få til…

Sukk… disse dokumentstandardene…

Jeg så at bloggen ble nevnt i en liten diskusjon om i hvilken grad det offentlige er pålagt å ta i mot ulike dokumentformater. Det twitteret viste til var skrevet for over et år siden og jeg ble litt usikker på om det var helt oppdatert.

Fra tidligere var det et rimelig spenstig krav i Referansekatalogen om ulike dokumentformat. Nå er det igang et «Forslag om endring av forskrift om IT-standarder i offentlig forvaltning«, der hovedideen er:

Difi mener at det kan være hensiktsmessig å endre kravene til redigerbare dokumenter ved publisering på offentlige virksomheters nettsider og ved utveksling av redigerbare dokumenter som vedlegg til e-post. Det foreslås at det ikke stilles krav til standarder for redigerbare dokumenter innen anvendelsesområdet. Samtidig foreslås det obligatoriske krav til hvilke redigerbare formater offentlig sektor plikter å ta i mot.

I praksis betyr denne endringen at de sidestiller ODF og OOXML med denne begrunnelsen:

Office Open XML ISO/IEC 29500:2011 (OOXML) er et dokumentformat opprinnelig utviklet av Microsoft med tilsvarende anvendelsesområde som ODF. Formatet er blant annet tatt i bruk i nyere versjoner av kontorstøtteprogamvaren MS Office.

Men dette er vel ikke helt korrekt (fra Wikipedia)…

Starting with Microsoft Office 2007, the Office Open XML file formats have become the default target file format of Microsoft Office, although the Strict variant of the standard is not yet fully supported. Microsoft Office 2010 provides read support for ECMA-376, read/write support for ISO/IEC 29500 Transitional, and read support for ISO/IEC 29500 Strict. Microsoft has stated that Microsoft Office 2013 will support both read and write of ISO/IEC 29500 Strict.

Det er bare «Strict» som er godkjent som en åpent dokumentstandard. Til diskusjonen om de ulike utgavene av OOXML viser til et tidligere blogginnlegg – det er fremdeles aktuelt.  Jeg synes det er litt pussig at Microsoft Office 2010 støtter lesing av et format de ikke kan skrive :-)

I praksis betyr denne endringen at en rekke offentlige kontor kommer til å publisere ting i alle forskjellige utgaver av OOXML (bortsett fra den som er godkjent! – siden Microsoft Office 2013 enda ikke er sluppet) – og at du som sluttbruker ikke vet hvilket program du skal bruke for å åpne dokumentet rett! Jeg har allerede opplevd kaos rundt .docx-filer i Randaberg kommune, alt etter om de er laget i Office 2003, 2007 eller 2010. Dette blir ikke bedre når Office 2013 kommer, selv om den sies å lage «Strict»-utgaver av OOXML.

Og for å ta et dagligdags eksempel fra Prosjekt «Nettbrett» – både kontaktlærer og jeg har opplevd marerittliknende situasjoner når elevene leverer prøver/innleveringer skrevet i forskjellige programmer på nettbrett. Alle tekstbehandlingsappene vi bruker støtter DOCX/OOXML, men ingen av dem skriver innbyrdes forståelige utgaver av OOXML! Det er til og med slik at ulike versjoner av samme app skriver ulike versjoner av OOXML. Det er ikke ukjent at noen av appene ikke klarer å lese dokumentet den selv nettopp har lagret – til stor frustrasjon (og redsel) for elevene.

Så på siste RLE-prøve fikk jeg inn dokumenter fra elevene der noen ikke ville åpnes i Office 2010, men i LibreOffice. Andre ville ikke åpnes i LibreOffice, men i Office 2010. Ingen av dem ville åpnes i appen de var laget i. Noen av dokumentene forstod Office 2010 som skrevet på arabisk, så teksten ble skrevet fra høyre til venstre (men med latinske bokstaver). Google Drive leste noen av dem. Kaotisk – og helt håpløst for de som ikke er særlig bevandret i IT-verden. Løsningen ble å lagre dokumentet på nytt i det programmet som kunne lese dem. Da gjorde både LibreOffice og Office 2010 en god jobb og jeg kunne lese dokumentene i alle programmer etterpå – bortsett fra at Office 2010 insisterte på den arabiske skriveretningen. Det gjorde ikke Google Drive og LibreOffice med akkurat de samme dokumentene.

Verden trenger et offisielt åpent dokumentformat, og OOXML er ikke en god kandidat!

Ingen flere ukeplaner i .docx!

På fredag rakk Regjeringen å få ut en revisjon av forskrift om obligatoriske IT-standarder i offentlig forvaltning. Selvfølgelig får alle god tid på seg. Vel og merke gjelder PDF-kravet (altså ikke .docx) fra 1. januar 2010 på offentlige nettsider. Vedlegg i epost o.l. gjelder fra 1. juli 2011 – altså på fredag. Multimedia-ting gjelder i staten fra 1. januar 2012 og ett år seinere for kommuner. Og for de litt tekniske av oss – det er kjekt at det offentlige også skal over på UTF8.

Ingen flere ukeplaner i .docx på skolers hjemmesider! Ingen flere som publiserer video og lyd i Microsoft sine lukkede formater! Hurra!

Slipp dokumentene fri!

Hvorfor må du slippe dokumentene dine fri?
Vi lever i en tid hvor papir i økende grad erstattes av elektroniske dokumenter. Frie dokumenter er fundamentalt for at dokumentene dine skal lenger enn programmet du bruker nå og gjør at du fritt kan velge og endre program.

Frie dokumenter og demokrati
Elektroniske dokumenter inkluderer i dag også dokumenter hos staten, som f.eks. skattepapirer, juridiske avtaler og referater fra Stortinget. Et fungerende demokrati må være sikker på at staten har full kontroll over slike dokumenter. Det samme gjelder for utveksling av informasjon mellom stat og borger. Vi må aldri være avhengig av lukkede produkter til ett firma.

Dokumentfrihet og lommeboken din
Open Document Format (ODF) og andre åpne standarder er sentrale for å kunne ha et fritt marked og fri konkurranse mellom ulike løsninger, fordi brukerne da kan velge fritt. Slik konkurranse fører også til bedre pris og funksjonalitet for alle – også deg!

Hvor kan jeg lære mer?
Besøk Document Freedom Day (DFD) sitt nettsted og lær mer om frie dokumenter og åpne standarder.

Hvordan kan jeg slippe dokumentene mine fri?
Hjelp oss øke bevisstheten om disse tingene ved å vise dem til DFD og lag en lenke til dem fra nettstedet ditt! Gjør et valg og lagre alle dokumentene dine i ODF nå. Hvis programmet ditt ikke støtter ODF… Last ned et program som gjør det!

DOCX ≠ en åpen standard

Over hele verden ser stater i økende grad betydningen av åpne IKT-standarder for å oppmuntre til mangfold og interoperabilitet, lavere kostnader og til å fremme innovasjon. At et åpent format skal brukes til offentlige dokumenter har nå blitt allment akseptert i offentlig sektor, og gjort at løsninger med åpne standard er en sentral av det offentliges IKT-strategier. Selv om dette har resultert i at Open Document Format (ODF) er blitt allment anerkjent og stadig mer akseptert av offentlig sektor, er det fortsatt forvirring og utfordringer med implementering av påståtte alternativer, som Microsofts Office Open XML (OOXML) – som til daglig omtales som DOCX-dokumenter.

Suksessen for en standard blir målt etter hvilke problemer den løser og hvilke muligheter den gir for innovasjon. Behovet for interoperabilitet, valgmuligheter og fleksibilitet blir ofte nevnt som motivasjonen for å lage og å ta i bruk åpne IKT-standarder. OOXML oppstod derimot som en reaksjon fra Microsoft for å fylle et «standard-hull» i midten av 2005. Da var det flere land som krevde åpne standarder, EU krevde større åpenhet rundt dokumentformater og flere merket risikoen for «vendor lock-in» (det å bli låst til en leverandør). Uten støtte for et åpent dokumentformat i Microsoft Office ville bruken av Office rundt omkring i verden være truet – spesielt når kravet ble en del av innkjøpsanbudet for IKT-programmer. Dette kommer også frem i beskrivelsen av hvilke behov OOXML skulle løse når det hele tiden må tas hensyn til eksisterende formater i Microsoft Office og behovet for å utvide standarden og støtte interoperabilitet. Fordi det hastet med å få på plass standarden og siden den skulle passe til en eksisterende lukket standard, ble OOXML laget uten nok arbeid for å bygge en konsensus i IKT-verden eller med nok samarbeid med konkurrenter for å tilpasse en akseptabel industristandard. Det var også en diskusjon om i hvilken grad det var nødvendig med en ny åpen dokumentstandard når det allerede eksisterte en (ODF).

Dette første til at OOXML ikke fikk nok stemmer til å bli godkjent som en standard i første avstemning i den internasjonale organisasjonen for standardisering (ISO). Mange av kommentarene var knyttet til at OOXML var for bundet opp til operativsystemet Windows. Microsoft gjorde flere endringer med standarden. Det mest sentrale var innføringen av to varianter av standarden. For å bli godkjent hadde Microsoft gått med på å flytte de delene av OOXML som var Windows-avhengige, og som derfor bare Microsoft kunne bruke, over i en «Transitional»-del av standarden. Den skulle bare brukes til å åpne gamle Microsoft Office-dokumenter. Det ble eksplisitt uttrykket at «Transitional»-delen ikke skulle brukes til å lage nye dokumenter. I en «Strict»-del ble det gjort en rekke forbedringer for å tilfredsstille ISO. Det var denne delen som skulle brukes når en laget nye dokumenter. På grunnlag av disse forbedringene ble OOXML ISO-godkjent i andre runde av avstemningene. I mars 2008 ble standarden ISO/IEC 29500 godkjent med to utgaver: «Strict» (streng) og «Transitional» (overgang).

Siden 2008 har det skjedd en del med det som skulle er OOXML og som skulle være ISO/IEC 29500. I dag er standarden fragmenter i flere ulike utgaver – og ingen av dem er støttet av Microsoft Office. Per november 2010 så det slik ut:

  • Ecma 376-varianten av OOXML er den utgaven ISO forkastet. Denne passer godt til det Office 2007 gjør når du lager dokumenter, men den mangler en del elementer. Varianten inneholder også en rekke avhengigheter til Windows. Bruken av Ecma 376 binder i praksis brukeren til Microsoft Office.
  • ISO/IEC 29500 «Strict»-varianten er den ISO godkjente til bruk for nye dokumenter. Verken Office 2007 eller Office 2010 kan lagre/skrive «Strict»-dokumenter. Microsoft har enda ikke kommet med noen offisiell uttalelse om når de fullt ut vil implementere ISO/IEC 29500 «Strict».
  • ISO/IEC 2950 «Transitional»-varianten er den som ikke skulle brukes til å lage nye dokumenter. Verken Office2007 eller Office 2010 har implementert denne utgaven fullt ut. Office 2010 lagrer dokumenter med en ikke-standardisert form av «Transitional» som inneholder en rekke proprietære/lukkende utvidelser. Disse utvidelsene er ikke sendt til ISO for godkjenning/standardisering.

For å gjøre det lett for brukerne har Microsoft kalt alle disse variantene av OOXML for .DOCX når du lagrer et dokument… :-)

At Microsoft ikke implementerer «Strict» samtidig som de utvider «Transitional» for seg selv, betyr at de ignorerer de forbedringene de måtte gjøre for å bli godkjent av ISO. Dette spriket mellom ISO-standarden og hva Microsoft faktisk gjør har fått mange til å tvile på om Microsoft faktisk ønsker å lage en ny åpen standard. Kortutgaven er at det enda ikke finnes noe program som kan lage den åpne standarden Microsoft har fått godkjent – derfor finnes den i praksis ikke.

De fleste stater som tar i bruk åpne standarder gjør dette fordi de ønsker å unngå «vendor lock-in», få lavere utgifter, økt interoperabilitet, økt tilgang til offentlige dokumenter og sikre bevaringen av disse dokumentene over lang tid. Noen, ikke alle, har også mål om å øke konkurransen og til og med å oppfordre til bruk av fri programvare. Uansett – inntil (og om ikke) den ISO-godkjente «Strict»-utgaven av OOXML er fullt implementert av Microsoft og andre leverandører, vil enhver stat som bruker OOXML være låst i en lukket standard som ikke lever opp til de målene de har satt.

Per dags dato er det bare ODF-standarden som er godkjent i Norge som en åpen standard i det offentlige… fordi det i praksis er den eneste åpne dokumentstandarden som eksisterer!