콘텐츠로 건너뛰기

2023년 International Conference on Electronics, Information, and Communication(ICEIC) – 박준호

[학회 후기]
2023년 2월 5일부터 8일까지 싱가폴에서 진행된 ICEIC 2023에서 oral 발표자로 참석하게 되었다. 4개국 이상이 참여하고 전체 발표자 중 외국기관 소속이 50% 이상인 대규모 학회여서 그런지 다양하고 훌륭한 연구자분들을 만날 수 있는 좋은 기회였다. 특히, 본인이 연구하는 컴퓨터비전 분야 뿐만 아니라 전력회로, 자율주행, IoT, 반도체 등 여러 분야의 선진 연구를 접해볼 수도 있어서 견문을 넓힐 수 있었다. 세션 중간의 커피 브레이크 타임마다 세계 각지에서 방문한 사람들과 각자 연구하고 있는 분야와 그 생태계에 대한 이야기를 듣는 것도 상당히 흥미로웠다. 기억에 남는 세션은 손호성 연구원의 “Multi-view stereo with recurrent neural networks for spatio-temporal consistent depth maps” 였다. 3차원 공간 정보(깊이) 추정 분야에서는 stereo matching 기반의 깊이 추정 방식 및 딥러닝 모델 기반 최적화 연구가 많이 진행되었는데, 이때 동영상 깊이 추정의 일관성이 challenge 중 하나로 남아있다고 한다. 시공간적 일관성 향상을 달성하기 위해 다양한 방법들이 제안되었는데, 그 중에서 손 연구원은 순환 신경망을 활용하는 것을 제안하였다. 이 연구는 성능도 향상되었을 뿐만 아니라, 모델 구동 및 학습 과정을 end-to-end 구조로 구현했다는 점이 인상깊었다. 이번 학회를 통해 연구에 동기부여를 얻을 수 있었고, 앞으로 더욱 좋은 논문을 많이 써서 더 큰 학회에 참석할 수 있는 기회를 많이 만들어야겠다고 다짐하였다.
[발표 후기]

발표 주제는 “Whole-body Human Mesh Reconstruction with Transformer”로, 신체, 손, 얼굴 등 신체 모든 부위를 3D mesh로 복원하는 문제를 인공지능 분야에서 state-of-the-art 아키텍쳐인 Transformer로 해결한 연구이다. Whole-body human mesh reconstruction은 신체 여러 부위를 동시에 복원해야 하는데, 각 부위마다 깊이 정보가 제각각 이어서 어렵다고 여겨진다. 따라서 부위에 따라 attention score를 책정하여 깊이 정보를 formulation하는데 도움이 되는 Transformer를 활용한다. 그 결과 기존 방법 대비 정성적, 정량적으로 높은 성능을 달성하였다. 이 내용을 oral 발표로 준비해야 하는 부담감이 있어서, 대본 준비 뿐만 아니라 여러 예상 질문들을 대비하기 위한 답변도 준비하였다. 본인 발표 세션에는 생각보다 질문이 없어서 연구자들과 해당 주제에 대한 대화는 할 수 없었으나, 포스터 발표만 해보고 oral 발표는 처음인 점, 영어로 준비해야 한다는 점, 발표하는 내용 뿐만 아니라 발표하는 방식(표정, 자세 등 비언어적인 요소들)도 중요하다는 점 등 얻은 것이 많은 경험이었다. 한편, 발표에서 나온 질문은 다음과 같다.
(질문) 해당 연구를 어떻게 확장할 수 있을지 궁금하다.
(답변) 지금까지 whole-body human mesh reconstruction 분야는 신체 부위만 정확하게 복원하는 것을 타겟으로 하고 있는데, 이제는 사람이 입고 있는 옷이나 신발, 모자 등 의류를 복원하는 문제로 연구를 확장할 수 있을 것 같다. ECCV 2022에서도 관련 논문이 등장하였고, AR/VR 등 다양한 어플리케이션 분야에서 활용성이 크기 때문에 앞으로 나올 연구들에 대한 기대가 크다.