Pubblicato il 30/09/09 - aggiornato il  | 4 commenti :

Come estrarre testo da un'immagine con Google Docs.

Google Documenti nella battaglia per i servizi online sul tipo di Office segna un altro punto a favore di Google nei confronti dei rivali della Microsoft. Il metodo OCR consiste nell'estrapolare del testo da un'immagine. Ho già parlato di JOCR, un tool che svolge questo compito ma adesso è chiaro che da un'applicazione messa a punto da BigG ci si aspetta tutta un'altra affidabilità.

La funzionalità in effetti non è ancora pienamente disponibile ma si può già testare in una live demo messa a disposizione degli utenti, come comunicato da Google Operating System. 

Possono essere caricati file in alta risoluzione JPG, GIF o PNG fino a 10MB e Google Docs ne estrae il testo che vi è contenuto. Google comunica che l'operazione non porta via più di 40 secondi.

Per testare la funzione ho fatto uno screenshot di un post di questo blog e l'ho salvato come JPG, quindi l'ho caricato nel live-form messo a disposizione da Google Documenti. Prima di inserire l'immagine occorre effettuare l'accesso, quindi selezionare il file immagine

 

image

Cliccando su Start OCR import si effettua la conversione. Ecco accostati l'immagine ed il testo che ne è stato ricavato con questa applicazione

screenshot_articolo                       image

 

Devo dire che ci sono molti errori e che, per il momento, questa feature è certamente deludente.



4 commenti :

  1. ciao Pars,
    veramente interessante come spesso accade leggendo le notizie che ci riporti sul tuo blog.
    speriamo che la grande G riesca a fare un ottimo lavoro, magari non so ancora l'ocr non è pronto per la lingua italiana, hai provato con un testo inglese?

    RispondiElimina
  2. @vit
    Non ho provato con un testo inglese, può essere che funzioni meglio o forse dipende anche dalla qualità delle immagini e dalla quantità di testo presente. Non ho tempo ma sarebbe interessante provare con un PDF convertito in JPG per vedere che tipo di testo estrae. Ciao

    RispondiElimina
  3. e se il testo non fosse in caratteri latini bens' in cirillico ?

    RispondiElimina
  4. @alieno
    Semplice! Imposti la lingua di Google Docs sul russo, l'ucraino, il bielorusso, il bulgaro o il serbo a seconda dei casi, quindi segui lo stesso procedimento.
    E' chiaro che in questo caso bisogna avere dei rudimenti linguistici almeno elementari per poter scegliere i link giusti oppure si possono memorizzare precedentemente le zone dei pulsanti in cui cliccare :D

    RispondiElimina

Non inserire link cliccabili altrimenti il commento verrà eliminato. Metti la spunta a Inviami notifiche per essere avvertito via email di nuovi commenti.
Info sulla Privacy