포도가게의 개발일지
Track g4dn inference server OOM 본문
반응형
virt 43.635, res 0.014t
근데 cpu사용률 왤케 높지?
음.. 현재 datadog에서 항상 죽을때 log가 4k이상 쌓이는걸 볼 수 있다. 음 main container 메모리는 하드 리밋이 걸어놓은대로 잘 걸려있다. 이에 반해 logrouter가 메모리 리밋이 걸려있지 않네..? 문제가 생길 수 있을 것 같은데.. 높은 확률로 문제가 되어 보인다. 우선 infer server에 리밋을 좀더 13gib로 할당이 필요해보이고 logrouter에도 추가적인 hardlimit 조치가 필요해보인다.
'Tech' 카테고리의 다른 글
[K8S] AWS EKS IRSA 동작 (0) | 2024.04.23 |
---|---|
쿠버네티스(k8s) (0) | 2023.03.19 |
Monorepo vs Multirepo (1) | 2022.10.05 |
Object[5] (0) | 2022.04.20 |
Object[4] (0) | 2022.04.16 |
Comments