Notice
Recent Posts
Recent Comments
Link
관리 메뉴

one by one ◼◻◼◻

[NLP 논문리뷰] MMTOD : Improving End-to-End Task-Oriented Dialogue System with A Simple Auxiliary Task 본문

논문리뷰

[NLP 논문리뷰] MMTOD : Improving End-to-End Task-Oriented Dialogue System with A Simple Auxiliary Task

JihyunLee 2021. 12. 9. 21:53

제목 : Improving End-to-End Task-Oriented Dialogue System with A Simple Auxiliary Task

링크 : https://aclanthology.org/2021.findings-emnlp.112.pdf

이 논문은 TOD(Task Oriented Dialog)의 generation 부분에서 현재 SOTA를 달성한 모델입니다.

리뷰 시작하겠습니다.

모델의 전체 구조

 

다른논문과의 차별성 = auxiliary task

이 논문이 다른 논문들보다 좋은 성능이 나올 수 있었던 것은, 논문 제목에서도 볼 수 있듯, 좋은 Auxiliary Task의 역할이 컸습니다.

Auxiliary Task란 본 task는 아니지만, 본 task에서의 성능이 더 잘 나올 수 있도록 도와주는 보조 task를 의미합니다. MMTOD논문에서는 span prediction을 auxiliary task로 사용하였습니다. 여기서 span matching은 slot tagging과 비슷한 방법으로 span prediction을 사용하였습니다.

위 모델 전체 구조에서 보라색 부분이 auxilary task를 의미합니다. Response generation이나 belef traking에 도움이 되는 결과물을 전달하는 구조는 아니지만, slot tagging을 이용해서, 어떤 부분에 '음식' 정보, '시간' 정보가 있는지를 알려주어, Encoder가 문장을 더 잘 이해하도록 만들었습니다.

 

사실 놀랍게도(?) 이 논문에서 이 이외의 구조나 방법의 특이점은 찾지 못했습니다. 그러나 여기서 사용한 auxiliary task가 정말로 창의적이고, 그러면서도 모델의 학습에 도움이 되었다는 점이 재미있었고, 제 연구에도 적용 할 방법을 찾을 수 있겠다는 생각을 하게 되었습니다.

 

한가지 아쉬운점은 이렇게 학습을 하게 되면, 1. ontology파일(유저가 말하는 중요 정보(=음식이름, 가게이름, 시간 등)을 미리 정의한 파일)가 있어서 어느 부분이 음식이고, 시간인지 미리 알아야 한다는점, 2. few shot trainning에도 이 방법이 먹힐까? 하는 의문이 남습니다.

 

 

Comments