In generale, il Data Scraping è una tecnica di estrazione di dati proveniente da un altro programma e consente ad un utente (umano o robot) di elaborarli.
Nella Robotic Process Automation è particolarmente utilizzata per consentire ai robot la manipolazione massiva di dati diminuendo il rischio dell’errore umano ed ottimizzando la generazione di dashboard grazie a kpi più accurati.
Il Data Scraping nell’RPA
La tecnica del Data Scraping, insieme allo Screen Scraping, è ottimizzata se i robot lavorano su programmi/siti web ben strutturati che permettono la lettura diretta di un elemento.
L’ambiente di UiPath Studio prevede una tecnica efficiente di estrazione dati tramite il Data Scraping che consente inoltre di strutturare questi dati in una tabella logica per contestualizzarli ed estrarli sotto forma di file Excel o per inserirli in un Database.
UiPath e i metodi principali per lo Scraping
UiPath Studio mantiene una serie di metodi che utilizzano lo Scraping per l’estrazione/lettura dei dati:
- FullText: è il metodo predefinito, è veloce e preciso, ma a differenza del metodo Native non può estrarre le coordinate dello schermo del testo.
- Native: a differenza degli altri due, il metodo Native funziona solo con le app create per eseguire il rendering del testo con Graphics Device Interface (GSI).
- OCR: non è accurato al 100% ma può essere utile per estrarre il testo che gli altri due metodi non potrebbero, poiché funziona con tutte le applicazioni, incluso Citrix.
UiPath Studio utilizza due motori OCR, per impostazione predefinita: Google Tesseract e Microsoft Modi.