IconQA데이터셋은 세계에존재하는 다양한 객체들의
추상적 다이어그램을 활용하여 생성된
다양한 VQA문제를 훈련할 수 있는
데이터 셋이다.
위 이미지의 $2 \times 3$행렬에서
1행의 이미지들은 유명한 데이터셋 VQA, VQA2.0과
3d도형을 통해 symbolic 모델에 적용하기 위한
CLEVR데이터 셋의 예제들이다.
2행의 이미지들은 실제 세계의 다양한 객체 클래스 들에 대한
abstract diagram으로 구성된 IconQA데이터셋의 예제들이다.
위의 표1은 Task에 따른 데이터셋의 예제들의 갯수
Train, Val, Test별 예제들의 갯수를 나타내고
표2는 각 태스크별 스킬의 갯수를 나타낸다.
아래 그림을 통해
데이터셋의 예제들의 질문이 대충 몇 가지 경우의 수로 추려진다는 것을 알 수 있다.
왼쪽 표를 통해 데이터셋이 재미있는 다양한 Skill들로 구성되어있음을 알 수 있다.
bAbI데이터셋이 텍스트로 구성된 재미있는 태스크들이 많았다면
IconQA는 시각데이터를 사용해 풀 수 있는 재미있는 태스크들로 구성되어있다.
위 그림은 데이터셋에 사용될 수 있는 다양한 클래스의 아이콘들을 나타낸다.
아래 그림을 통해 좀 더 다양한 종류의 문제들을 구경하도록 하자.
'인공지능' 카테고리의 다른 글
Arrows are the Verbs of Diagrams (0) | 2023.02.07 |
---|---|
ScienceQA (0) | 2023.02.07 |
PhraseCut (0) | 2023.02.07 |
The children's book test(CBT) (0) | 2023.02.07 |
bAbI test (0) | 2023.02.07 |