[학회 후기]
컴퓨터비전 분야 top-tier 학회인 CVPR 2024에 발표자로 참석하였다. 이번 CVPR은 6월 17일부터 6월 21일까지 총 5일간 열렸으며, 6월 17-18일은 워크숍(Workshops)과 튜토리얼(Tutorials)이, 6월 19-21일은 메인 컨퍼런스(Main Conference)와 엑스포(Expo)가 진행되었다.
우선 Workshop 기간에는 기존에 관심 있었던 Human과 관련된 주제를 선정하여 세미나에 참석하였다. 기억에 남는 워크숍 주제는 “Rhobin Challenge on Reconstruction of Human-Object Interaction”였다. 이번 워크숍은 인간-객체 상호작용을 복원하는 연구가 이미지 기반의 단순 복원을 넘어, 시간에 따른 상호작용 추적 및 동적 장면 상호작용과 같은 확장된 주제를 다루고 있었다. 특히, 인간-객체 상호작용 추적과 이미지 기반 접촉 추정을 위한 새로운 작업이 포함된 두 가지 추가 트랙이 소개되었으며, 이를 위해 InterCap과 DAMON이라는 두 개의 새로운 데이터셋이 활용되었다. 이를 통해 인간-객체 상호작용의 연구가 점점 더 정밀하고 동적인 방향으로 나아가고 있음을 알 수 있었다.
또한 Main Conference 기간에는 여러 발표자들과 연구 이야기를 나눌 수 있었다. 특히 인상 깊었던 논문은 “RoHM: Robust 3D Human Motion Reconstruction” 이었다. RoHM은 단안 RGB(-D) 비디오에서 노이즈와 가림(occlusion)이 있는 상황에서도 강건한 3D 인간 모션을 복원하기 위한 Diffusion Model 기반 접근법으로, 기존 방법론보다 일관된 motion을 복원한 모델이었다. 특히 재밌었던 점은 발표가 끝난 뒤 우연히 논문의 저자를 로비에서 만나게 되었는데, 캐주얼하게 여러 질문도 나누고 발표에 대한 감동을 전하면서 연구 의지를 키울 수 있었다.
[발표 후기]
우리 팀은 Skeleton 기반의 Human-Object Interaction을 위한 Image Editing을 주제로 포스터 발표를 진행하였다. 감사하게도 많은 분들이 우리의 발표에 관심을 가져 주셨고, 여러 기업과 연구실에서 오신 연구자 분들이 해주시는 질문을 통해 미처 생각하지 못했던 부분을 다시금 생각해볼 수 있었다. 우리가 발표한 논문은 “Person in Place: Generating Associative Skeleton-Guidance Maps for Human-Object Interaction Image Editing”였다. 한편 기억에 남는 질문은 다음과 같다.
- 질문: 제안하는 이미지 편집 기법이 Stable Diffusion이 아닌 다른 모델을 사용하더라도 적용 가능한가?
- 답변: 우리의 방법론은 Plug&Play로 적용할 수 있기 때문에, Skeleton 기반의 이미지 편집 기술은 모두 적용이 가능하다.
이 질문을 통해 추후 이미지 편집 기술이 발전된다면, 우리의 연구도 함께 발전할 가능성을 떠올려보았다.