콘텐츠로 건너뛰기

2025년 International Workshop on Observing and Understanding Hands in Action (ICCV-Workshop) – 송민서

[학회 후기]
ICCV 2025 HANDS workshop에 발표자로 참석하였다. 본 학회는 2025년 10월 19일부터 23일까지 미국 하와이에서 개최되었으며, 컴퓨터 비전 분야의 최신 연구 동향을 직접 확인할 수 있는 의미 있는 행사였다. 특히 Hand-Object Interaction(HOI) 및 Diffusion Transformer 기반 이미지 생성 연구 방향에 집중하여 다양한 세션에 참여하였다.

가장 인상 깊었던 세션은 International Workshop on Observing and Understanding Hands in Action으로, egocentric 시점에서의 손-객체 상호작용 인식 및 생성 연구가 활발히 논의되었다. 더불어 diffusion transformer 기반 세션을 통해 positional embedding, token merging 전략 등 최신 모델 설계 방향을 파악할 수 있었고, 실제 연구자들과 토론하며 향후 개선 아이디어를 구체화할 수 있었다. 글로벌 기업 부스 탐방을 통해 산업적 적용 가능성 역시 확인하였다. 이번 ICCV 참석은 HOI 및 generative model 연구에 대한 시야를 확장하고, 차기 연구 계획을 구체화하는 데 큰 도움이 되었다.

[발표 후기]
이번 학회에서 발표한 연구 제목은 **“Replace-in-Ego: Text-Guided Object Replacement in Egocentric Hand-Object Interaction”**이다. 본 연구는 egocentric 카메라 시점에서 손과 물체가 상호작용하는 장면에서, 텍스트 조건과 레퍼런스 이미지를 기반으로 물체를 새로운 객체로 대체하는 모델을 제안하였다. 특히, FLUX 기반 diffusion transformer를 활용하여 손과 배경의 자연스러운 연결성과 실감나는 객체 치환 품질을 확보하는 데 초점을 맞추었다.

포스터 발표 과정에서는 reference 이미지와 target 이미지 간 명암 차이, hand pose consistency 유지, 텍스트 프롬프트 활용 방안 등 다양한 기술적 질문이 제기되었다. 특히 positional embedding 및 token merging 방식에 대한 의견 교환이 활발히 이루어졌으며, 추가적인 성능 개선 방향에 대한 피드백도 다수 수집할 수 있었다.

이번 발표 경험을 통해 국제 학회에서의 연구 교류 역량을 강화하였으며, 향후 더 높은 수준의 연구 성과를 목표로 글로벌 연구자들과 지속적인 교류 및 발전을 이어가고자 한다. 다음 학회에서는 더 완성도 높은 결과로 발표할 수 있도록 연구를 심화할 계획이다.