
OCR e AI: la chiave per digitalizzare le idee su carta
Qualche giorno fa stavo facendo alcuni ragionamenti su un progetto al quale sto lavorando. In queste situazioni il mio media preferito è ancora la carta e, infatti, avevo schizzato su un comodo foglio A3 una mappa concettuale abbastanza profonda.
Il mio flusso di lavoro prevedeva a quel punto la digitalizzazione della mappa e la sua conversione, tramite un qualunque chatbot AI, in una mappa in formato mermaid (una sintassi markdown per realizzare grafici): si tratta di un approccio che uso da un po’ e che ha velocizzato tantissimo il mio modo di lavorare rispetto al classico PowerPoint.
Il problema che ho incontrato – e in realtà quello con cui mi scontro il più delle volte – è il passaggio intermedio dalla carta al testo digitale. Infatti, la mia grafia, specie quando scrivo di getto, è pessima e tutte le soluzioni OCR (Optical Character Recognition) provate finora hanno un tasso di successo abbastanza basso: chi mi comprende meglio è gemini 2, ma, nel migliore dei casi, solo per circa il 65% del testo.
L’OCR è una tecnologia che non scatena quell’effetto WOW dei chatbot AI, ma che, a mio avviso, è tra le più utili in assoluto. Il trasferimento delle informazioni dalla carta (o dall’ambiente che ci circonda) al digitale, per poi essere rielaborate sia con sistemi tradizionali che tramite Intelligenza Artificiale è uno degli snodi sui quali si possono avere grandi soddisfazioni in termini di efficienza di un processo.
Mi ha fatto, quindi, molto piacere l’annuncio di Mistral – il campione dell’AI francese – di un nuovo modello OCR che promette faville. Non ho avuto ancora modo di testarlo, ma se sarà in grado di comprendere la mia cacografia sono certo diventerà uno dei miei strumenti più utilizzati!
W le Intelligenze Artificiali pratiche!