Nota post-Infornata 26 novembre 2016

Cari amici,

eccovi questa nuova infornata, una miscellanea che fa da preludio al famigerato Cen(t()one natalizio, su cui sto lavorando in questi ultimi giorni.
Con le festività si cerca di essere tutti più buoni, o almeno così afferma il senso comune. Il vostro Natjus al desco natalizio invece vi farà trovare una bella banda di “cattivi”.
Ma non voglio rivelare altro in anticipo, perciò subito mi taccio.

Se volete aiutare il blog avete due possibilità:

1. Donare un contributo in denaro, che permetterà al mastro fornaio di mantenere, e perché no aumentare, la qualità dell’offerta di LDB. Questo è il:

LINK DONAZIONE

2. condividere a vostra volta materiale (se possibile inedito sul web) con la comunità.

Con affetto

Natjus

Advertisements

77 thoughts on “Nota post-Infornata 26 novembre 2016

  1. Grandissimo Ponzio, grazie infinite! Corro a finire la conversione.
    E grazie di nuovo a Grattacielo per lo scan originario.

  2. Brunico, un salve,a te a tutti, ed un consiglio. Ho visto che su HathiTrust tra i tasti di destra c’è l’opzione “plain text” . Se la scegli la pagina viene convertita in una pagina di testo da copiare ed incollare dove vuoi (mantiene la formattazione). Scorri le pagine con le frecce, e il salvataggio dovrebbe andare a buonissimo fine.
    Spero ti sia utile.

  3. Brunico un consiglio. Sulla pagina di hatitrust, a destra c’è un tasto opzione “full text”, con quella scelta ottieni una pagina con testo selezionabile e copiabile, ma che mantiene la sua formattazione. Con le frecce in alto scorri le pagine, e il tuo lavoro scorre

  4. Grazie a Stryc9 per la segnalazione. Tuttavia, a questo punto avrei bisogno, da neofita, di un consiglio. Io solitamente “fotografo” la pagina e la salvo come immagine per poi convertire tutte le immagini in un unico pdf. Al contrario con la funzione segnalata dall’amico posso copiare il testo della pagina, ad esempio, sul word. Però il file alla fine sarà solo testo perdendo le caratteristiche tipografiche originali. Dunque andrebbe poi ricostruito per renderlo come l’originale. Ho bisogno di sapere, ai fini di una futura conversione in epub, quale sia la strada più conveniente. Grazie.

  5. Dimenticavo, i file pdf si aprono solo con l’Adobe (ragioni di limitazioni imposte dalla fonte da cui ho tratto i materiali)

  6. Se carichi su cloud (mega o altro) una cartella con tutte le pagine slegate (in pdf o qualsiasi altro formato) mi offro io di sistemarle in un unico pdf (in condizioni ottimali per visualizzarlo con le caratteristiche dell’impaginazione originale) (la creazione di epub non è il mio forte… eventualmente qualcun altro potrà continuare il lavoro in quel senso)

  7. Ti ringrazio per la disponibilità, in realtà anche io sono capace di unire tutti i pdf in un unico documento. La questione che ponevo era relativa al salvataggio delle pagine come testo oppure come “immagine” (salvando così la “forma” orignale, tra l’altro, tipicamente “einaudiana”.

  8. Ciao Brunico! A mio parere è conveniente conservare le caratteristiche tipografiche originali e dunque convertire jpeg in pdf, dal quale poi è comunque agevole ricavare l’epub. Salvare in modalità testo significa perdere quelle caratteristiche ed essere costretti ad allestire il solo epub per avere un soddisfacente esito finale.

  9. Salve Nat! il mio cordiale saluto per te e per tutti gli amici della comunità,volevo dare qualche piccolo consiglio e come converto i miei file di qualsiasi formato rispondendo di conseguenza ai nostri amici, BruNico, Aletinus, Stryc9.

    1-Andiamo su https://babel.hathitrust.org/cgi/pt?id=mdp.39015016795471;view=plaintext;page=root;size=100;seq=17;num=xiii
    2-Sulla destra della pagina cercate-plain text…
    3-Get this Book-Download this page (PDF)-cosi facendo trasforma e converte ogni singola pagina in pdf-(uso firefox) un pò complicato perche si devono unire tutte le pagine e occorerebbe adobe acrobat pro,o simile, comunque si può fare.

    Secondo metodo,sempre un pò lungo ma ugualmente efficace.

    1-Andiamo su https://babel.hathitrust.org/cgi/pt?id=mdp.39015016795471;view=plaintext;page=root;size=100;seq=17;num=xiii
    2-Sulla destra della pagina cercate-plain text…
    3-Seleziona tutto-(la pagina)copia-aprire -LibreOffice-open document testo-(similare di Word di Microsoft -il primo.Gratis, piu leggero e fa delle cose in più,il mio modesto parere)e inserisci tutte le pagine una ad una-incollate.fatto tutto il lavoro con tutte le pagine…
    4-(sempre su libre office) in alto c’è un bottone-ESPORTA NEL FORMATO PDF-converte tutto in un unico pdf,fatto,salvate-
    Spero di esservi stato d’aiuto.

  10. Ho notato che su hathitrust si può scaricare una pagina per volta in pdf cliccando a sinistra su “Download this page (PDF)” oppure per fare più veloci col tasto destro del mouse “salva destinazione con nome” (con Mozilla Firefox). Il pdf creato mantiene l’OCR, ha sul fondo e sul bordo a sinistra delle note che possono essere cancellate con Adobe Acrobat Pro.
    Ciao
    Giorgio

  11. Grazie per queste informazioni. Nella mia prima risposta a Brunico alludevo a questo metodo o a una procedura analoga, ma si trattava del ricordo sbiadito di un passato quasi remoto e non sarei stato in grado di fornire delucidazioni.

  12. Salve amici! mi ricollego al precedente messaggio per completare il discorso sulla conversione nei diversi formati.
    Una volta creato il file txt con LibreOffice, importantissimo perchè e la madre di tutte le future conversioni,fate così…

    1-Per chi vuole solo un epub lo potete creare direttamente con LibreOffice inserendo un’estensione
    http://extensions.openoffice.org/fr/project/writer2epub

    2-Il più completo!,partendo sempre e creato il file txt con LibreOffice-aprire il mitico CALIBRE
    https://calibre-ebook.com/
    e da lì convertire in qualsiasi formato desiderato.

    Un pensiero e un caloroso e cordiale saluto agli amici,Grattacielo.Zovvo,Aletinus.
    Per NatJus,sono arrivato a LDB molti anni fà cercando un libro- poi ho sempre seguito il blog in tutte le sue trasmigrazioni-scribd,Google drive.
    Grazie,Grazie Grande NATJUS!.

  13. Ottimi suggerimenti. Però, personalmente, preferisco salvare come immagini le pagine semplicemente posizionandomi su una pagina alla volta e con il tasto sinistro del mouse scegliere “salva immagine con nome”. Questo perchè ho un programmino che alla fine userò per convertire velocemente tutti i file immagine in un unico pdf, mentre per unire tanti pdf dovrei utilizzare le utilità online che sono lente e spesso non precise nell’unificare i vari pdf nell’ordine giusto.

  14. Per velocizzare puoi anche fare le due cose. Salvare le immagini in pdf per avere una versione “tipografica”, e il testo per l’epub, e risparmiarti il passaggio ocr del pdf.

  15. Ciao, scusate se m’intrometto, ma questo è il link diretto a una pagina del libro (la 27) recuperato con Firefox tramite l’estensione Page Info Button (https://addons.mozilla.org/it/firefox/addon/page-info-button/):
    https://babel.hathitrust.org/cgi/imgsrv/image?id=mdp.39015016795471;seq=69;width=850
    Aprendolo nel browser si ottieme il file immagine. Il campo “seq” è l’unica parte variabile dell’indirizzo e cambia da pagina a pagina (la prima pagina ha seq=1, la seconda seq=2 e così via fino a raggiungere l’ultima che, nel nostro caso, è seq=544).
    Non ho provato, ma forse si può scrivere un batch che permetta di richiedere al server di hathitrust una lista predefinita con gli indirizzi delle immagini delle pagine, scaricarle e salvarle in locale. In teoria non dovrebbe essere troppo complicato. Sempre che non ci siano delle limitazioni lato server…

  16. Oplà! Ecco qua un piccolo batch scritto con AutoIt (https://www.autoitscript.com/site/) che permette il download delle immagini dal sito di HathiTrust senza alcuna interazione da parte dell’utente se non il settaggio di alcuni parametri iniziali. Le immagini scaricate sono larghe 850 pixel (x 1220 pixel di altezza), penso che questo valore si possa modificare (dovrei vedere) ma già così dovrebbero essere buone per un ocr.
    Il batch è molto triviale per la verità e sicuramente migliorabile, ma sufficiente per dimostrare che il download si può fare con un po’ meno lavoro rispetto a uno screenshot pagina per pagina.
    Nel file rar (di cui allego l’indirizzo in fondo) si trovano il sorgente in AutoIt, un eseguibile (il sorgente compilato) per chi non avesse AutoIt installato, un file leggimi.txt (spero) sufficientemente esplicativo e un file Init.txt. Quest’ultimo è il file più importante perché definisce alcuni parametri necessari a scaricare le immagini del libro desiderato. Particolarmente, per il corretto funzionamento del batch, devono essere settati i seguenti parametri (uno per linea nel file Init.txt):

    Numero della prima pagina da scaricare
    Numero dell’ultima pagina da scaricare
    ID del libro
    URL del server immagini di HathiTrust (da lasciare com’è)
    Directory locale in cui salvare le immagini

    I primi tre parametri possono essere reperiti dall’url del libro da scaricare semplicemente andando a una delle pagine desiderate. Prendiamo ad esempio il link su HathiTrust della pagina 28 del libro di Leone Ginzburg, “Scritti”, Einaudi 1964 citato più sopra:
    https://babel.hathitrust.org/cgi/pt?id=mdp.39015016795471;view=1up;seq=70;size=125
    Da questo link occorre estrapolare la stringa che segue il valore id (cioè mdp.39015016795471) che appunto rappresenta l’ID del libro sul server immagini di HathiTrust e il valore seq che varia da pagina a pagina in maniera progressiva ma non sempre coerente (infatti nel caso di pag. 28 il valore è 70, colpa delle romane all’inizio del libro). I valori che c’interessano sono dunque i seq che rappresentano l’immagine relativa alla pagina e vanno riportati come prima e seconda voce del file Init.txt (se si volesse scaricare questo libro della prima pagina fino all’ultima, copertine comprese, occorrerebbe impostare 1 e 544) e l’id da impostare come terza voce del medesimo file.
    La quarta voce, il server d’immagini di HathiTrust, va lasciato com’è perché credo sia sempre quello.
    La quinta voce, la directory di download locale, è ovviamente personalizzabile.

    Il file rar col batch si trova qui. Spero che a qualcuno possa servire.
    https://mega.nz/#!yg4VyQyb!_iubTmjEJEXTZyManb7SQqUjwgQBD96_Nv1gaJKsCdQ
    Saluti

  17. Ho seguito la procedura iniziatiIca per l’ ammissione ai testi.credo di non avere sbagliato.dovrei attendere sull’ acount mega,un link,Non arriva,temo che non arrivara’ mai,e non o sufficiente fantasia per far finta che sia arrivato,,

  18. Ricevuto l’ archivio.Semplicemente una meraviglia-Sono emozionato.Questa e’ un impresa fantastica.che fa venire la voglia di collaborare in ogni modo possibile

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...