Cu ajutorul tehnologiilor moderne, procesarea documentelor este mult mai rapida si mai usoara. Acum se poate automatiza intregul ciclu factura-plata in asa fel incat operatorul intervine numai in punctele cheie de decizie (accepta plata facturii si decide ziua platii), restul procesului fiind efectuat de roboti.
Tehnologia RPA
Tehnologia RPA (Robotic Process Automation) este un tip de software care preia activitatea unei ființe umane în realizarea unei sarcini în cadrul unui proces.
Folosind instrumentele RPA, o companie poate configura software-ul sau un „robot”, pentru a capta și interpreta aplicații sau documente pentru procesarea unei tranzacții, procesarea datelor, declanșarea răspunsurilor și comunicarea cu alte sisteme digitale. Scenariile RPA variază de la ceva atât de simplu precum generarea unui răspuns automat la un e-mail până la implementarea a mii de roboți, fiecare programat pentru automatizarea proceselor într-un sistem ERP.
Poate face lucruri repetitive mai rapid, precis decât oamenii, eliberându-i să îndeplinească alte sarcini care necesită puncte forte umane, cum ar fi inteligența emoțională, raționamentul, judecata și interacțiunea cu clientul.
Tehnologia OCR
Recunoasterea optica a caracterelor (OCR) este identificarea electronica si codificarea digitala a textului tiparit cu ajutorul unui scaner optic si software specializat. Utilizarea software-ului OCR permite unui computer sa citeasca imagini statice de text si sa le transforme în date editabile, care pot fi cautate.
Folosit pe scara larga ca forma de introducere a datelor din inregistrari de date tiparite pe hartie – indiferent daca sunt documente de identitate, facturi, extrase bancare, chitante computerizate, carti de vizita, posta, tiparituri de date statice sau orice documentatie adecvata – este o metoda obisnuita de digitalizare a textelor tiparite, astfel incat sa poata fi editate electronic, cautate, stocate mai compact, afisate on-line si utilizate in procesele automate, cum ar fi calculul cognitiv, traducerea automata, conversie text-in-vorbire, date cheie si extragerea textului.
Recunoasterea optica a caracterelor implica 3 pasi
Deschiderea si/sau
scanarea unui document
in software-ul OCR
Recunoasterea
documentului din
software-ul OCR
Salvarea documentului
produs de OCR intr-un
format ales
Caracteristici principale
Modulul de imagine
Incarcati si salvati imagini in formate precum BMP, PNG, TIFF, PDF si JPEG. Folositi compresia JPEG2000 si JBIG2 (extensie separata).
Posibilitate de preprocesare
Curatati imaginile originale, cu caracteristici precum binarizarea adaptiva, filtrele de despeckle, functia de deskew, rotirea documentelor. Indepartarea marginilor intunecate, eliminarea liniilor, abandonarea culorii sunt disponibile intr-o extensie separata.
Recunoaste 137+ limbi
Recunoaste 137+ limbi cu diferite suplimente: asiatice, ebraice, arabe, fonturi bancare, ICR.
Recunoastere barcode
Modulul nostru de recunoaștere a codurilor de bare este capabil sa recunoasca codurile de bare populare 1D cum ar fi codul 39, codul 128, EAN, UPC. O extensie suplimentara permite decodarea codurilor de bare 2D pentru recunoasterea PDF417, cod QR si matrice de date.
Salvarea documentelor in mai multe formate
Formatele de iesire a documentelor în IRIS OCR sunt:
PDF, PDF / A, HTML, XML, RTF, TXT, ODT, WordML, SpreadsheetML, CSV, DOCX, XLSX și XPS. Un modul suplimentar de compresie genereaza fisiere comprimate folosind tehnologia noastra iHQC in PDF și XPS.
Procesarea paginilor
– Recunoastere zonala
– Recunoasterea automata a orientarii paginii
– Corectia automata a perspectivei imaginilor documentelor capturate prin aparatul foto
– Capacitati de îndepartare automata a gaurilor de perforare
– Adaugati un separator ca o pagina goala sau un cod de bare între fiecare document pentru a spune software-ului OCR sa creeze fisiere diferite de iesire dintr-un singur lot de documente.
Scrierea de mana
Scrierea de mana cursiva nu poate fi recunoscuta cu tehnologia OCR, deoarece „recunoasterea optica a caracterelor” este reglata doar pentru textele tiparite
Textul scris de mana poate fi recunoscut numai daca caracterele sunt scrise separat („text imprimat manual”). Acest scenariu de recunoastere este numit ICR si cel mai des utilizat pentru:
– Recunoasterea zonala (OCR, ICR)
– Prelucrarea formularelor
Ce rezolutie trebuie sa aiba imaginea?
Recomandam ca documentele sa fie scanate cu rezolutie de 300 dpi.
– Pentru textele obisnuite (dimensiunea fontului 8-10 puncte) se recomanda utilizarea rezolutiei de 300 dpi pentru OCR
– O rezolutie mai mica va duce la o degradare a calitatii si a vitezei
– Pentru dimensiuni de font mai mici decat 8 puncte, se recomanda o rezolutie de 400-600 dpi
– Dimensiunea fontului de la 12 la 20 de puncte este cea mai buna pentru o calitate si o viteza mai bune
Scanarea
Caracterele scrise pe fundaluri gri sau colorate pot duce la erori de recunoastere, deoarece acest fundal îngreuneaza citirea caracterelor. Cu toate acestea, datorita tehnologiei noastre de ultima generatie, culorile sunt interpretate separat si pot fi eliminate în procesul de recunoastere daca au caractere suprapuse. Prin urmare, recomandarea noastra este scanarea color daca documentele au zone de culoare. Cu toate acestea, chiar daca documentele sunt doar alb-negru, recomandam în continuare scanarea color pentru a mentine un flux uniform, deoarece diferenta de viteza dintre scanarea color si scanarea alb-negru este minima.
IRIS – Furnizor de Tehnologie OCR
Denumirea IRIS provine de la Image Recognition Integrated Systems (sisteme integrate de recunoastere a imaginii). La IRIS, construim software si produse care ajuta oamenii sa isi creasca productivitatea in timp ce scaneaza si convertesc documente. Facilitam scanarea, editarea si partajarea fisierelor digitale.
IRIS Products & Technologies Division, parte a grupului IRIS Group, dezvolta tehnologii si produse pentru recunoasterea inteligenta a documentelor si isi comercializeaza portofoliul la nivel mondial prin parteneriate puternice. Reteaua de parteneri este unul dintre cei trei piloni ai IRIS Products & Technologies Division, impreuna cu partenerii OEM si solutiile proprii.
Mai putin hartie, mai mult continut este deviza noastra. Asa cum se presupune ca fiecare motto face, rezuma ceea ce isi propun solutiile noastre. Pentru a face o poveste lunga, am fost printre pionieri in domeniul recunoasterii textului. O stapanim. Suntem azi pionieri in solutii care va aduc valoarea reala pe care o merita banii dvs.: continutul documentelor. Aurul de astazi este informatia, informatiile sunt disponibile pe hartie si in fisiere; Gestionam extragerea informatiilor din ambele pentru a va permite sa exploatati continutul din ele la cel mai ieftin cost si la cel mai mare randament al investitiei.
Tehnologia PolCo
PolCo este o tehnologie unica de identificare a unei zone de informatie compacta, dezvoltata de DigiSinergy , care utilizeaza un set de algoritmi specifici.
Bazata pe reverse ingineering a modului de tiparire a documentelor, foloseste mecanisme de AI pentru a identifica zonele care contin date corelate, la fel cum procedeaza creierul uman la citire. Toate cuvintele bazate pe caractere și fonturi similare sunt combinate în anumite grupuri/zone. Totodata, PolCo poate folosi forme poligonale definite de utilizator pentru a grupa anumite zone din document, chiar daca acestea nu sunt adiacente, devenind astfel un instrument de identificare mult mai puternic decat ochiul uman.
Folosind PolCo un document poate fi impartit imediat in zone independente si fiecare zona poate fi prelucrata in mod specific.PolCo reuseste sa identifice cu acuratete zonele care contin informatia, fara sa amestece informatia cu sensuri diferite sau din zone adiacente.
Caracteristici principale
Separa documentul in zone independente
Identifica zone pe baza modului in care sunt scrise
Identifica grupuri in cadrul zonelelor definite cu tehnologia ADD
Identificare poligonala a zonelor similare si procesarea lor ca un tot unitar
Tehnologia ADD
Adaptive Document Data Recognition
ADD este o tehnologie unica de recunoastere a formei unui document, dezvoltata de DigiSinergy , care utilizeaza un set de algoritmi specifici. Avand la baza forma documentului si folosind procese de invatare scurte, efectuate usor de operator, ADD extrapoleaza informatiile si se adapteaza noilor situatii pe care le intalneste, reusind sa idenfice corect informatia.
Cu informatia structurata in diverse zone specifice unui document (header, body, footer, etc) ADD recunoaste fiecare zona si extrage iformatia necesara. Impreuna cu tehnologia Polco, ADD se adapteaza la documente multi-pagina, chiar daca acestea au forme diferite, reusind sa selecteze informatia necesara. Are rezultate excelente in citirea liniilor de informatii din documente, chiar daca acestea au diferente de layout intre ele. Pentru ADD trecerea de la o pagina la alta nu creeaza probleme, chiar daca paginile nu au layout identic. ADD elimina toate rezidurile care nu contin informatii, adaptandu-se la fiecare pagina si chiar la liniile de informatie care se afla pe mai multe pagini.
Caracteristici principale
Proceseaza documente multi-pagina care au pagini cu forme diferite
Proceseaza documente care contin caractere scrise cu diverse fonturi de diferite marimi
Proceseaza un bloc de informatie chiar daca acesta este scris pe mai multe pagini
Ignora zonele care nu au informatie importanta, chiar daca acestea se intrepatrund cu zonele de informatie
Tehnologia Blue Machine
BlueMachine este o tehnologie unica, bazata pe Machine Learning si Artificial Intelligence, dezvoltata de DigiSinergy , care poate adauga anumite informatii continute intr-o lista la un set de date extras dintr-un document (sau existent in orice alt mod), utilizand un set de algoritmi specifici.
Blue Machine este o masina cu AI care invata de la operator sau din istoric, preluand ulterior sarcinile operatorului, adaugand campuri necesare la fiecare linie de informatie. Invata din fiecare interventie a operatorului, atentioneaza operatorul cand acesta isi schimba comportamentul, dar isi insuseste noul comportament la indicatia operatorului.
Astfel BlueMachine poate fi folosita si in fluxuri cu doua nivele de competenta, nivel 1 si nivel 2, si daca informatia introdusa de nivel 1 este corectata de nivel 2, la urmatoarea introducere eronata de catre nivel 1, BlueMachine va semnaliza operatorul, eliminand astfel o noua greseala. BlueMachine va invata la randul sau operatorul nivel 1 sa introduca corect datele in conformitate cu recomandarile operatorului nivel 2. Astfel se obtin date exacte, cu grade de eroare mult mai mici decat in cazul operatorului uman.
Tehnologia SmartCorrect
SmartCorrect este un set de algoritmi specifici, dezvoltat de DigiSinergy, utilizat pentru identificarea erorilor in cadrul unui document. In general, aceste erori apar in urma procesului OCR, dar ele mai pot aparea chiar si la crearea documentului.
Identificarea erorilor se face atat pe baza unor caracteristici specifice documentului cat si pe baza unor reguli generale. Acestea pot fi definite atat in cadrul modulului SmartCorrect cat si de catre operator, in cadrul utilizarii aplicatiei. In cazul aparitiei unei erori aceasta va fi semnalata intuitiv utilizatorului.