GitHub topics: text-reconstruction

Repositories

joanrod/ocr-vqgan

OCR-VQGAN, a discrete image encoder (tokenizer and detokenizer) for figure images in Paper2Fig100k dataset. Implementation of OCR Perceptual loss for clear text-within-image generation. Fork from VQGAN in CompVis/taming-transformers

Language: Python - Size: 2.76 MB - Last synced at: almost 2 years ago - Pushed at: over 2 years ago - Stars: 44 - Forks: 1

Related Keywords

dataset 1 deep-generative-model 1 deep-learning 1 image-generation 1 image-reconstruction 1 ocr 1 ocr-vqgan 1 paper2fig 1 paper2fig100k 1 taming-transformers 1 text-reconstruction 1 vqgan 1

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Repos

GitHub topics: text-reconstruction

joanrod/ocr-vqgan