Nougat: Neural Optical Understanding for Academic Documents

Abstract La conoscenza scientifica è prevalentemente archiviata in libri e riviste scientifiche, spesso sotto forma di PDF. Tuttavia, il formato PDF comporta una perdita di informazioni semantiche, in particolare per le espressioni matematiche. Proponiamo Nougat (Neural Optical Understanding for Academic Documents), un modello di trasformatore visivo che esegue un’operazione di riconoscimento ottico dei caratteri (OCR) […]