활동 기록

[논문] HCLT 2020 '과학 논문 초록 말뭉치 구축 및 선학습 트랜스포머 기반 초록 자동구조화 방법'

uni2237 2021. 1. 31.
728x90
728x90

제 32 회 한글 및 한국어 정보처리 학술대회 논문집 (2020 년)에 기재되었습니다.

 

요약)
논문 초록은 논문의 내용을 요약해 제시함으로써 독자들의 연구결과물에 대한 빠른 검색과 이해를 도모한다.
초록의 구성은 대부분 전형적인 경우가 많기 때문에, 초록의 구조를 자동 분석하여 색인해두면
유사구조 초록을 검색하거나 생성하는 등의 연구효율화에 기여할 수 있다.
허세훈 외 (2019)는 초록 자동구조화를 위한 말뭉치 SPA2019 및 기계학습기반의 자동구조화 방법을 제시하였다. 본 연구는, 기존 SPA2019의 구조화 오류를 바로잡고, SPA2019에서 추출한 1,346개의 초록데이터와
2,385개의 초록데이터를 추가한 SPA2020 말뭉치를 새로이 소개한다.
또한, 다양한 선학습 기반 트랜스포머들을 활용하여 초록 자동구조화를 수행하였으며, 그 결과 BERT-0.86%, RoBERTa-0.86%, ALBERT-0.84%, XLNet-0.86%, DistilBERT-0.85% 등의 자동구조화 성능을 보임을 확인하였다.

주제어: 기계학습, 선학습 기반 트랜스포머, 초록 구조화

 

논문 pdf

과학 논문 초록 말뭉치 구축 및 선학습 트랜스포머 기반 초록 자동구조화 방법.pdf
0.51MB

 

구두 발표 자료

과학 논문 초록 말뭉치 구축 및 선학습 트랜스포머 기반 초록 자동구조화 방법_구두발표.pdf
1.37MB

728x90

'활동 기록' 카테고리의 다른 글

[동계백마인턴] 활동 증빙자료  (0) 2021.01.28

댓글