이전 포스트에서 몇 가지 모니터링 방법을 알아보았었는데, 그 중 InfluxDB + CAdvisor를 조합한 모니터링 방법에서 메모리 사용량 데이터 오류가 있었다고 언급했었다. Grafana에서 수집된 데이터를 시각화 했을 때, 메모리 사용량의 값이 비정상적으로 높게 나오는 것이다.
일단 InfluxDB에 쌓이고 있는 메모리 사용량 수치가 우리가 원하지 않는 값인 것만은 명확하다. 왜 값이 저렇게 나오는지 원인을 찾으려면 못 찾을 것은 없긴 하지만...
원인을 찾는 데에 시간이 얼마나 걸릴지 모르기 때문에 다른 모니터링 방법을 알아보기로 했다. 일단 모니터링의 조건과 해당 사항을 조사한 바는 아래와 같다, (1) 모든 컨테이너 별로, 스웜 모드의 Service 별로, Stack 별로 모니터링이 가능해야 한다. - 모니터링의 granularity가 명확해야 하며, 해당 데이터를 entity 별로 쉽게 가져올 수 있어야 한다.
CAdvisor의 /metrics REST를 사용하려고도 했...