Archivi del giorno: maggio 18, 2012

La combo che spakka: Writer2ePub & MyTXTCleaner

EpubA volte, quando prendo in mano l’e-reader di Siobhàn, o la guardo leggere da sopra la spalla, il mio corpo è squassato da convulsioni molto poco eleganti. Se è stata una giornata particolarmente stressante, non è insolito che crolli a terra sbavante, ripetendo con voce sommessa “l’orrore, l’orrore”.
Ora: sarò anche ossessivo (io sono di diverso avviso), ma certe cose non si possono proprio vedere. L’e-book tipico che si può trovare nel lettore della Siò è infatti un pdf formattato a culo, con a capi completamente a caso e interlinea variabile. Il risultato è quasi altrettanto fastidioso di un wall of text.

Per il bene del mio equilibrio spirituale, ho passato anni (be’, no: settimane) a battermi per avere e-book che fossero una festa per gli occhi.
Uno dei primi programmi con cui sono venuto a contatto naturalmente è Calibre, ma non sono mai rimasto particolarmente soddisfatto dalle sue conversioni. Codice sporco, a capi impazziti che dovevo correggere a mano, e altre piccole amenità che a volte fanno riflettere se valga poi la pena di convertire un pdf. Finché ho trovato due piccoli programmi semplici semplici da usare.
Calibre va bene se il file di partenza è un mobipocket, e soprattutto è utile per rimuovere gli odiosi DRM (qui il Duca spiega come). Ma in tutti gli altri casi, la soluzione ideale è la combo MyTXTCleaner + Writer2ePub. E oggi voglio spiegarvi come funzionano.

Writer2epubWriter2ePub + MyTXTCleaner
Se voglio creare un epub e il mio file di partenza è un .pdf, un .doc, un .psd, un .rtf o un .txt, allora questi due programmi saranno la mia prima scelta. In teoria questi programmi funzionano benissimo anche se il mio file di partenza è un .html; in realtà, però, in quest’ultimo caso si fa prima a utilizzare Sigil.

Cosa sono?
Sono due plug-in compatibili con i word processor OpenOffice, LibreOffice e NeoOffice 1.

A cosa serve MyTXTCleaner?
Serve a cancellare gli a capi forzati e tutte quelle stramberie di formattazione che spesso infestano i file di testo importati da un pdf. Non è un convertitore: tutto quello che fa è cancellare gli accapi che non seguano un segno di punteggiatura forte.
Nella definizione di Luke:

Vi è mai capitato di trovarvi
davanti ad un testo che
va a capo
in maniera imprevedibile e che
non riuscite in
alcun modo a sistemare, proprio
come questo?

Ciò accade perché nel testo sono presenti dei caratteri di fine paragrafo indesiderati. Se prendiamo del testo proveniente da un PDF, inevitabilmente ad ogni fine riga ci ritroveremo con un fine paragrafo.
A questo punto, o ci mettiamo lì con tanta pazienza e li cancelliamo uno per uno, riga per riga, o utilizziamo la macro MyTXTcleaner che farà il lavoro per noi.

A cosa serve Writer2ePub?
Converte i file .odt e .doc in un epub pulito e altamente personalizzabile, completo di indicizzazione, copertina e metadati.

Dove si possono scaricare?
Qui si può scaricare MyTXTCleaner; qui si può scaricare Writer2epub.

Come si usano
Per prima cosa, apriamo il nostro file con uno dei word processor sopraindicati (nel mio caso, utilizzerò LibreOffice). Se il file di partenza è in formato .doc, .rtf o .txt potrete aprirli normalmente con il programma. Se il file di partenza è un pdf, dovrete fare un banale passo in più – ossia selezionare tutto il testo contenuto nel pdf, copiarlo e incollarlo in un nuovo documento del word processor che avete scelto.

1. Pulire il file di testo
Se a questo punto, come capita 9 volte su 10, il vostro file presenta i consueti problemi di a capi e altri misteri della formattazione, cliccate sul pulsante di MyTXTCleaner e il programma farà in pochi secondi una pulizia dell’intero documento.
L’unico problema di MyTXTCleaner è che cancella anche gli accapi dopo i titoli dei capitoli, quindi bisogna poi fare un check manuale per ripristinarli.

Screenshot MyTXTCleaner

Oggi ho preso una botta in testa e ho deciso di convertire Il signore degli anelli!

2. L’indicizzazione
Se vogliamo che il nostro libro sia indicizzato per parti, capitoli e sottocapitoli, dobbiamo creare una TOC (Table of Contents).
Per far questo, i word processor ci mettono a disposizione le intestazioni (in inglese, headings). Possiamo assegnare un’intestazione a ciascuno dei capitoli del nostro libro aprendo il menu a tendina che, di default, si trova a sinistra del menu di selezione del font.
Le Intestazioni 1 sono quelle più grandi, che ricomprendono tutte le altre. Ogni Intestazione 2 sarà contenuta all’interno dell’Intestazione 1 precedente, e ogni Intestazione 3 sarà contenuta all’interno dell’Intestazione 2 precedente, e così via. In genere, utilizzo l’Intestazione 1 per il titolo del libro e per i titoli delle parti del libro, le Intestazioni 2 per i capitoli e (quando ce ne sono) le Intestazioni 3 per i sotto-capitoli. Ma ognuno può fare come più gli aggrada.
Nota: quando evidenziate un titolo per trasformarlo in intestazione, assicuratevi che non ci siano a capi. Il programma infatti riconosce l’a capo come uno stacco, quindi di fatto creerà due diverse intestazioni anziché una sola. Questo potrebbe diventare fastidioso in futuro, quando per esempio direte a Writer2ePub di creare un’interruzione di pagina ogni volta che si presenta una Intestazione1 o Intestazione2.

Screenshot02 Intestazioni

Chi usa un word processor (cioè tutti) dovrebbe già sapere cosa sia un’intestazione, ma meglio andare sul sicuro.

Non preoccupatevi dell’aspetto che prenderanno le intestazioni nel programma di testo: saranno poi modificate nella conversione in epub. Che è quanto andremo a fare adesso.

3. Settare Writer2ePub
Per prima cosa, apriamo le “Preferences” di Writer2ePub – per accedervi, cliccate sul tasto con la piccola “p” rossa accanto al simbolo “e” del programma. Qui potrete scegliere alcune delle configurazioni più importanti del vostro futuro epub; tra cui:
– Divisione dei file. Stabilisce quando il programma deve creare un’interruzione di pagina. “Prima di Intestazione 1”, per esempio, significa che quando il programma incontra un’Intestazione 1, inizia una nuova pagina con essa.
– Font. Decidete quale sarà il font del vostro epub. Uno dei limiti del Writer, infatti, è che nella conversione tutti i font del file di partenza vengono trasformati in un unico font che decidete adesso.

Screenshot03 Preferences

4. Metadati e conversione
Okay, abbiamo quasi finito; quello che rimane da fare è inserire i metadati del libro (titolo, nome dell’autore, ISBN, eccetera; anche una copertina!) e avviare la conversione. Il pulsante di mezzo fra i tre di Writer2ePub apre il menu dei metadati, ma in realtà si può inserirli direttamente in fase di conversione.
Cliccate sul pulsante più a sinistra dei tre di Writer2ePub, date un’ultima occhiata ai metadati e avviate la conversione. Fatto!

Attenzione.
La conversione mantiene le dimensioni del testo, le intestazioni, e l’uso di corsivo, grassetto, sottolineato, gli elenchi puntati e numerati, le tabelle e le immagini. Ma nient’altro: altre eventuali modifiche verranno perse nella conversione.

Screenshot04 Metadati

Il signore degli anelli è pronto a infestare il mio e-reader.

A questo punto il vostro epub è pronto; potete aprirlo e controllarlo con un programma che legge gli epub (come Sigil)2 o caricarlo direttamente nel lettore per verificare l’effetto.
Avrete un epub indicizzato come volete voi, con gli a capi decisi dall’autore invece che dalla follia della formattazione di un pdf, e con un codice sufficientemente pulito da poterci lavorare ulteriormente con altri programmi senza impazzire. Un libro di bell’aspetto migliora l’esperienza di lettura.

Tra l’altro, ho tanto preso in giro Siobhàn, ma è stata lei a iniziarmi a tutto questo. Mi ha anche dato una mano a sistemare questo articolo.
Io infatti, quando si tratta di imparare nuovi programmi, sono intellettualmente pigro; e se non fosse per lei, forse a quest’ora sarei ancora a sniffare la carta ^-^

Sniffare libri

Il vero appeal del libro di carta.

Per maggior informazioni su Writer2ePub, non mancate di visitare questa pagina.

————-

(1) Negli ultimi mesi, sia MyTXTCleaner che Writer2epub hanno cominciato ad avere problemi con OpenOffice. E’ successo a me, e poco tempo dopo anche a Siobhàn. Sospetto che questo abbia a che fare con l’ultimo aggiornamento di OpenOffice.
Per questo motivo, siamo passati da OpenOffice a LibreOffice, che al momento funziona a meraviglia.Torna su
(2) In futuro dedicherò sicuramente un articolo a Sigil, un programma per modificare gli epub che in poco tempo è diventato un altro dei miei preferiti. Ma dato che sono una persona ordinata, ho deciso di tenere separati i vari programmi in post differenti.Torna su

Annunci