본문 바로가기

인공지능

A Diagram Is Worth A Dozen Images

위와같은 그림들이 포함되어있는 데이터셋과

Arrows are the Verbs of Diagrams데이터셋을 동시에 활용하면

에이전트가 과학적 다이어그램을 잘 해석하고 설명할 수 있도록

훈련을 시킬 수 있을 것이다.

이 데이터셋을 만든 저자진은 위의 그림과같이 LSTM을 사용하여 Diagram Parse Graph를 그리는 모델을 사용하였다.

위 그림과같이 그림과 화살표를 보고 맨 아래 행처럼 Parse Graph를 생성할 수 있다.

위 그림과같이 충분히 학습된 에이전트 모델은

화살표로 설명되어있는 그림을 보고 질문에 대한 답을 하는 QA태스크를 수행할 수 있다.

GitHub - allenai/dqa-net: Diagram question answering system described in "A Diagram is Worth a Dozen Images"

 

GitHub - allenai/dqa-net: Diagram question answering system described in "A Diagram is Worth a Dozen Images"

Diagram question answering system described in "A Diagram is Worth a Dozen Images" - GitHub - allenai/dqa-net: Diagram question answering system described in "A Diagram is Worth a Do...

github.com

 

'인공지능' 카테고리의 다른 글

Screen parsing  (0) 2023.02.07
Look, Read and EnrichLearning from Scientific Figures and their Captions  (0) 2023.02.07
Arrows are the Verbs of Diagrams  (0) 2023.02.07
ScienceQA  (0) 2023.02.07
IconQA  (0) 2023.02.07