본문 바로가기

인공지능

ScienceQA

ScienceQA데이터셋은 다음 표와같이 다양한 도메인의 자연과학, 사회과학, 언어과학으로 구성된

멀티모달 데이터셋이다.

위의 표와같이 데이터셋은 미국 교육과정의 다양한 레벨에서 수집되었다.

이와같은 데이터셋 구조덕분에 커리큘럼 러닝이 용이할 것으로 예상된다.

다음 그림을 보자.

질문이 주어지고

콘텍스트를 읽고

옵션에서 적절한 답을 고를 수 있는 문제이다.

인공지능 에이전트는 콘텍스트를 읽고 질문에 답을 해야하는데

질문에 대한 답의 근거를 Lecture에서 언급된 물리학 지식에서 찾고 있다.

물리학 지식에서 근거를 얻어 질문에 대한 답을 얻는 과정을

Explanation과 같이 순차적으로 설명할 수 있다.

설명가능성이 높은 인공지능 에이전트 모델을 구축하기 적합한 데이터셋이라고 할 수 있다.

'인공지능' 카테고리의 다른 글

A Diagram Is Worth A Dozen Images  (0) 2023.02.07
Arrows are the Verbs of Diagrams  (0) 2023.02.07
IconQA  (0) 2023.02.07
PhraseCut  (0) 2023.02.07
The children's book test(CBT)  (0) 2023.02.07