DocToHtml – et svært nyttig verktøy

Mange av oss som publiserer på nett har gjerne lengre artikler vi ønsker å dele med verden. Ofte har vi skrevet disse artiklene i en eller annen tekstbehandler, som f.eks. Microsoft Word. Å importere disse artiklene i WordPress, eller hvilken publiseringsløsning vi nå bruker, trenger ikke være så enkelt – særlig ikke hvis vi ønsker å beholde formateringen artikkelen har fra før. Microsoft Word produserer temmelig ustandardisert og råtten HTML-kode, så det å importere artikkelen som HTML er ikke noe alternativ. Prøver vi å importere artikkelen i den visuelle editoren i WordPress ved å klippe og lime, fjerner WordPress mest mulig av HTML-koden for å oppnå et best mulig resultat. Det blir heller ikke noen optimal løsning, for da må vi gjerne gå gjennom teksten og lage formatering på nytt, slik at den igjen får det utseendet vi ønsker.

Jeg har ansvar for noen nettsteder der det stadig vekk er aktuelt å publisere stoff jeg har mottatt i Word-format eller i andre tekstbehandlingsformater. Normalt bruker jeg HTML-editoren i WordPress når jeg lager nye innlegg eller sider (det gjør jeg for øvrig nå når jeg skriver dette også). Det syns jeg er det greieste, for da føler jeg at jeg har full kontroll på det jeg legger ut og hvordan det blir presentert. Derfor syns jeg også det er en grei løsning å ha en tekst i reinest mulig HTML å lime inn. Men hvordan får jeg konvert tekstene til så rein HTML at jeg kan lime dem inn i HTML-editoren og publisere dem uten å måtte gjøre masse oppryddingsarbeid i dem først?

Jeg har etter hvert testet flere løsninger for konvertering av Microsoft Word-dokumenter til HTML – uten å bli helt fornøyd. Enten var det det ene, eller så var det det andre. Ett av verktøyene leverte riktignok rein og fin HTML, men håndterte ikke linjeskift særlig bra. Det medførte at hver linje i et avsnitt i originaldokumentet ble definert som et eget avsnitt i HTML-dokumentet, og jeg måtte gå gjennom hele teksten og rydde opp. Dette ble jeg ikke videre glad for.

For et par uker siden kom jeg tilfeldigvis over programmet DocToHtml fra Opilion Software. Jeg tenkte at det kunne være verdt å teste det også, siden jeg ennå ikke hadde funnet noe jeg var helt fornøyd med. Som tenkt, så gjort.

Inntrykket så langt er svært bra. DocToHtml har en mengde innstillingsmuligheter, og jeg opplever at det leverer fin og rein HTML jeg kan importere og bruke uten videre.

DocToHtml installerer seg som en add-in i Microsoft Word, og er avhengig av Word for å kunne gjøre jobben. For dem av oss som har Word installert på maskinen, er dette helt greit. Programmet kan kjøres via en ekstra menyfane i Word 2000/2003, eller fra båndet i nyere versjoner av Word. I tillegg kan det kjøres som eget program fra skrivebordet eller startmenyen i Windows, og det kan også integreres i «høyreklikkmenyen» i Windows Utforsker. DocToHtml fungerer utmerket i Windows 7.

Jeg har testet en beta av kommende versjon 3.0 av DocToHtml i noen dager, og jeg kan ikke si annet enn at jeg er meget godt fornøyd så langt. Dette er et verktøy jeg trygt kan anbefale!

DocToHtml er ikke gratis. En lisens koster USD 39, men med tanke på spart tid, spart arbeid og – ikke minst – spart frustrasjon, er dette ingen urimelig pris.

Du finner mer informasjon om DocToHtml på programmets eget nettsted Doc To HTML Converter. Der kan du også laste ned prøveversjon både av gjeldende utgave og betaversjon av kommende utgave.

Leave a comment

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *