Come digitalizzare un libro cartaceo in PDF

08/02/2021
L’avvento delle nuove tecnologie e dei nuovi media, ha portato alla cosiddetta rivoluzione digitale, ovvero un adeguamento degli standard di studio, conservazione, valorizzazione e comunicazione alle più moderne tecnologie digitali. Al giorno d’oggi infatti, gran parte dei testi cartacei di varia natura, vengono riversati sui cosiddetti supporti digitali. Questo processo, chiamato digitalizzazione, permette il passaggio dalla carta stampata alla versione per computer, tablet, smartphone e dispositivi appositi come gli e-book reader. Buona parte dei vantaggi di questo progresso, risiede nella praticità della sua conservazione e nella diffusione notevolmente più economica e rapida rispetto al tradizionale formato cartaceo. Un’enorme quantità di materiale, quindi, può essere immagazzinato in uno spazio estremamente ridotto, consentendo di organizzare raccolte complete ed ordinate ed essere suddiviso secondo specifici criteri. Qualunque testo può essere potenzialmente digitalizzato attraverso la scansione di ogni singola pagina. Tuttavia, prima di poter procedere con la scannerizzazione di un libro, è bene analizzarne la struttura così da poter scegliere al meglio il supporto o il metodo più adatto da utilizzare. Nel seguente articolo, andremo a vedere come digitalizzare un libro cartaceo in PDF in pochi, semplici passi.

Come già anticipato, per poter convertire un libro cartaceo in PDF, la prassi irrinunciabile è quella dell’acquisizione ottica del testo attraverso scanner, fondamentale per poter ottenere un buon risultato nella conversione. Vediamo i passaggi:
- per prima cosa, controlla l’integrità del libro originale andando a rimuovere eventuali pieghe, segni, macchie o segnalibri fra le pagine
- A questo punto, dobbiamo procedere con la scansione del testo: è possibile agire tramite il classico scanner piano, scanner portatili ed addirittura smartphone o fotocamere di alta qualità che possano eseguire foto ad alta definizione di ogni pagina
- Una volta scelto lo strumento da utilizzare, avviamo l’acquisizione (la pagina scansionata verrà salvata sotto forma di immagine in formato .jpg)
- Creiamo una cartella nella quale salvare le varie pagine del libro in ordine numerico
- Ora, per far sì che l’immagine venga convertita in un file di testo modificabile, è necessario utilizzare uno specifico software chiamato OCR (Optical Character Recognition), che analizza l’immagine e ne riconosce i caratteri tipografici restituendone il testo in un formato digitale
- Successivamente, andiamo a scaricare e installare PDF-XChange
- Nota: questo programma permette di passare dal cartaceo al digitale in pochi click, consentendo di realizzare copie digitali di libri, riviste e documenti, riconoscendone il testo acquisito tramite scanner e mantenendo la formattazione come quella originale. In questo modo, è possibile trasformare grandi collezioni di libri e documenti in file editabili
- Avviamo il programma e apriamo l’immagine da digitalizzare
- Nella parte alta dello schermo, clicchiamo su OCR
- Apparirà una nuova schermata nella quale sarà necessario configurare il programma alla lingua italiana, quindi andiamo su Main language > Italian
- A questo punto, il programma inizierà la digitalizzazione della pagina
- Una volta terminato il processo, sarà finalmente possibile lavorare sul testo oppure effettuare correzioni a livello grafico per migliorarne l’estetica e la leggibilità
Nota: questa procedura dovrà essere effettuata per ogni foglio scannerizzato. In alternativa, è possibile importare precedentemente tutte le immagini in un unico PDF (attraverso Smallpdf.com) e poi utilizzare la funzione OCR di PDF-XChange su tutto il file ottenuto.
Un’ultima cosa importante da sottolineare, è che la funzione OCR non è infallibile; spesso, infatti, non interpreta in modo corretto l’immagine e di conseguenza introduce caratteri tipografici estranei al testo. Ciò può avvenire a causa della scarsa qualità della scansione, della scorretta impostazione del software OCR oppure della leggibilità disturbata del testo a causa di segni presenti sulla carta.