Kubernetes 확장판: Gateway API
·
Ops
들어가며저는 현업에서 Kserve를 활용해서 모델 서빙을 하고 있습니다.Kserve는 Serveless 모드로 설치하는 것이 표준이었고, Istio/Knative와 함께 설치해서 사용하고 있었습니다. 그런데 0.15 버전부터는 RawDeployment 모드(0.16 버전부터는 Standard 모드라고 불림) 설치가 생겼고, LLM 서빙 시에는 해당 설치 방법이 권장된다고 합니다. 아무래도 Serverless 모드의 핵심인 'Scale-to-zero'는 LLM에서 비현실적으로 다가왔던 것 같습니다. 기가바이트 단위의 모델 가중치를 다시 로드하는 데 시간이 너무 오래 걸리기 때문입니다.Knative의 구성요소가 많고 디버깅도 어려워 걷어내고 싶다는 니즈가 있었는데, 여러 곳에서 유사한 고민이 있었던 것 같습..
MSA 환경에서의 API Gateway
·
Ops
요즘 MSA에 대한 지식을 새로 정의하고 있습니다.그러다보니, API Gateway의 역할과 중요성에 대해서 깨닫고 있는데요.이번 글에서 관련된 내용을 정리해보고자 합니다.MSA에 관련한 내용은 아래 글 참고해주세요!https://deep-flame.tistory.com/48 클라우드 네이티브 애플리케이션 디자인 패턴: AI 플랫폼 개발자의 아키텍처 성찰들어가며: 쿠버네티스를 쓴다고 모두 '클라우드 네이티브'는 아닙니다.저는 GPU 기반의 LLM 학습 및 서빙 플랫폼을 개발하고 있습니다.GPU 리소스 집약적인 로직을 다루다 보니 당연히 쿠버네티스deep-flame.tistory.com API Gateway란 무엇이며, 왜 필요한가?마이크로서비스 아키텍처(MSA)에서는 수많은 서비스가 존재합니다. API..
IT 엔지니어가 읽은 《알파폴드: AI 신약개발 혁신》
·
AI
들어가며: 우리는 왜 AI에 열광하는가인류는 왜 천문학적인 리소스를 투입하며 AI를 연구할까요? 단순히 원하는 답을 조금 더 빨리 찾기 위해서일까요?만약 AI가 인간이 이미 학습시킨 데이터를 그저 매끄럽게 요약해서 내뱉는 수준에 그쳤다면, 우리는 이토록 이 기술에 몰입하지 않았을 것입니다.AI의 진정한 가치는 인류가 오랫동안 풀지 못했던 난제를 해결하는 데 있다고 생각합니다.그 난제의 중심에는 바로 '생명(Life)'이 있습니다. 인류의 가장 근원적인 바람인 건강한 삶과 직결된 분야임에도 불구하고, 생명 현상은 그 복잡도가 상상을 초월합니다. 수십 년간 축적된 실험 데이터가 있음에도 불구하고 이를 해석하고 예측하는 데 다른 어떤 분야보다 긴 시간이 걸렸던 이유이기도 합니다.그러나 알파폴드로 인해서 단백질..
클라우드 네이티브 애플리케이션 디자인 패턴: AI 플랫폼 개발자의 아키텍처 성찰
·
Ops
들어가며: 쿠버네티스를 쓴다고 모두 '클라우드 네이티브'는 아닙니다.저는 GPU 기반의 LLM 학습 및 서빙 플랫폼을 개발하고 있습니다.GPU 리소스 집약적인 로직을 다루다 보니 당연히 쿠버네티스 환경을 사용하고 있으며, 나름대로 클라우드 네이티브한 환경에서 개발하고 있다고 생각했습니다.그러나 구현에만 집중한 나머지 결합도가 높아 문제가 발생했습니다.예를 들어 학습과 서빙 파트를 분리하고 싶은데, 현재 개발된 내용으로는 어렵습니다. 만약 MSA (MicroService Architecture)를 고려하여 느슨하게 서비스들을 개발했다면 어렵지 않게 문제를 해결했을 것 같다는 생각이 들었습니다.단순히 툴을 사용하는 것을 넘어, 클라우드 환경에 최적화된 설계의 본질을 이해하고 싶어 이 책을 접했습니다. 클라우..
MLOps Engineer가 보는 딥시크(DeepSeek)에 대한 생각
·
AI
딥시크(DeepSeek)는 2023년에 설립된 중국의 인공지능(AI) 기업으로, 대규모 언어 모델(LLM)을 개발하고 있습니다. 2025년 1월 10일, DeepSeek는 DeepSeek-R1 모델을 기반으로 한 무료 AI 어시스턴트 앱을 iOS와 안드로이드용으로 출시하였으며, 이 앱은 미국 iOS 앱 스토어에서 ChatGPT를 제치고 인기차트 1순위에 올랐습니다. 그만큼 현재 반응이 뜨겁습니다. 왜 이렇게 난리일까?딥시크는 저비용의 AI 솔루션을 제공함으로써, 기존의 AI 시장 구조를 변화시키고 있습니다. 특히 미국의 대형 AI 기업들에게 도전장을 내밀며, 글로벌 AI 시장에서 중요한 역할을 하고 있습니다.딥시크는 비용 효율성과 오픈 소스 모델을 통해 AI 기술의 접근성을 높여, 다양한 기업과 연구자..
복잡한 네트워크를 간단하게! Kubernetes Service를 알아보자 (ClusterIP, NodePort, LoadBalancer)
·
Ops
개인적으로 Kubernetes 네트워크가 복잡하다고 생각합니다.그도 어쩔 수 없는 게 클러스터 내부에 수 많은 애플리케이션들을 연결시키기 위해서는 그럴 수 밖에 없었을 것이라~ 생각합니다.그래도 나름 간단하게 하기 위한 노력도 보이니 우리 함께 최대한 이해해봅시다! Kubernetes Service 왜 필요해? 🤔먼저 우리가 생각해봐야할 게 있습니다.왜 이게 필요할까요? Pod의 성질이는 Pod의 성질에 관련이 있습니다.예를 들어 Deployment를 통해서 애플리케이션 배포를 관리하고 있는데, Pod가 모종의 이유로 죽게되고 다시 살아났다면 이 전 Pod가 사용했던 IP와 새로 생성된 Pod의 IP는 다르게 생성됩니다.그래서 Pod IP를 직접 사용하는 것은 위험한 방법이라고 할 수 있습니다.이를 해..