Mask Loss를 구할 때, 각 클래스 K모두에 대해서 왜 binary cross entropy를 하는가? 정답은 논문 글을 제대로 읽으면 이해할 수 있었다.
Mask R-CNN 논문 중 일부 - Mask R-CNN = Faster R-CNN + FCN -> Faster R-CNN 에서 classification을 하기 때문에 Softmax 수행 X -> Mask pixel 인지 아닌지만을 binary cross-entropy -> 클래스간 경쟁없이 없어 성능과 연산량 이점있을 것으로 예상 -> 일반화 하면 각 클래스 K 모두에 대해서 적용하지만 Mask Loss 에는 K번째 마스크만 정의 - RoI가 ground-truth인 각 클래스 -> 말 RoI에는 말 Mask 만 적용 -> 즉, Mask pixel인지 아닌지만을 학습 -> FCN과 달리 말인지 사람인지 고양이인지 경쟁X...