Abstract:
În multe domenii diferite, există o cerere abundentă pentru stocarea informațiilor în
format digital din informația disponibilă în documente, imagini tipărite sau scrise de mână pentru
a reutiliza ulterior aceste informații cu ajutorul calculatoarelor. Recunoașterea optică a
caracterelor (OCR) este o zonă de cercetare care încearcă să dezvolte un sistem informațional ce
are capacitatea de a extrage și prelucra textul din imagini în mod automat. Obiectivul OCR este
de a realiza modificarea sau conversia oricărei forme de text într-un format digital editabil, cum
ar fi text scris, imagini de text tipărite sau scanate, pentru o prelucrare mai profundă și ulterioară.
În această lucrare cercetăm și analizăm cea mai bună arhitectură a unei rețele convoluționale
pentru un model OCR. În primul rând, analizăm fazele generale ale unui sistem OCR. Apoi,
evidențiem cei mai buni algoritmi de construire a unei rețele neuronale și construim trei
arhitecturi diferite pentru a obține cele mai bune rezultate.