Singularity

  • 홈
  • 태그
  • 방명록

OCR 1

Donut : Document Understanding Transformer without OCR 논문리뷰

Abstract 2021년 11월 30일에 네이버 Clova AI 연구팀에서 제출된 논문입니다. 기존의 Visual Document Understanding(VDU)은 OCR을 base로 해서 동작하였기 때문에 계산 cost가 높고 OCR Error에 의한 성능하락이 있어왔습니다. 따라서 해당 논문에서는 OCR 프레임워크가 base에 없는 end-to-end 방식의 새로운 VDU 모델을 제안합니다. 또한 large-scale의 실제 문서이미지에 대한 의존을 줄이기 위해서 Synthetic Document Generator(SynthDog)도 같이 소개하며, 이를 이용해 모델을 pretrain 하였다고 합니다. Donut은 다양한 공공 및 사적 데이터셋들에 대해 시행한 Document Understandi..

AI 2021.12.06
1
더보기
프로필사진

파이썬과 AI쪽을 공부하고 있습니다. 공부하면서 배운 것들을 포스팅할 예정입니다.

  • 분류 전체보기 (15)
    • 파이썬 (4)
    • AI (11)

Tag

트랜스포머, pyautogui, Transformer, Hooking, Document Understanding, 파이썬, 파이토치, Keyboard, 인공지능, pytorch, Image Segmentation, 후킹, Ai, Attention, Python, Perceiver IO, VDU, 딥러닝, vit, Vision Transformer,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바