[조직소개]
우아한형제들 AI플랫폼팀은 다양한 AI 프로덕트를 만드는 팀들과 협업하여, 실제 서비스 프로덕트를 함께 개발하고 운영합니다.
우리는 프로덕트를 만들면서 동시에 재사용성과 확장성을 고려한 AI 플랫폼을 함께 구축하고 있습니다.
플랫폼은 기술 자체를 위한 것이 아니라, 프로덕트의 비즈니스 임팩트를 극대화하기 위한 수단으로 발전시켜 나갑니다.
필요한 기술을 신중하게 선택해 적용하며, ‘멋진 기술’보다는 ‘비즈니스에 필요한 기술’을 우선합니다.
👉 [기술블로그] 생성형 AI 서비스: 게이트웨이로 쉽게 시작하기
👉 [우아한테크세미나] MLOps를 활용한 AI 서비스 개발 스토리
[업무내용]
- 다양한 AI 프로덕트 개발팀과 협업하여, AI 플랫폼과 서비스를 함께 구축하고 운영합니다.
- 모델 개발과 서빙을 빠르고 안정적으로 지원할 수 있는 플랫폼 기능을 설계하고 개선합니다.
- ML/DL 모델의 학습, 배포, 모니터링을 지원하는 파이프라인을 구축하고 운영합니다.
_ 효율적이고 확장 가능한 모델 서빙 인프라를 구축하고, 상용화 및 안정적인 운영을 주도합니다.
- 플랫폼 고도화를 통해 AI 프로덕트의 비즈니스 임팩트를 강화합니다.
[지원자격]
- 7년 이상 ML/DL 기반 소프트웨어 개발 경험이 있는 분
- 다양한 팀과 협업하여 AI 프로덕트를 함께 만들어본 경험이 있는 분
- Kubernetes 환경 위에서 서비스를 개발, 배포, 운영해본 경험이 있는 분
- ML/DL 파이프라인 또는 AI 플랫폼을 구축하고 운영해본 경험이 있는 분
- 대규모 데이터 처리나 고트래픽 환경에서도 안정적으로 시스템을 운영해본 경험이 있는 분
- 필요한 기술을 상황에 맞게 선택하고 적용하여 비즈니스 가치를 만들어낼 수 있는 분
- 기술 자체보다는 문제 해결과 비즈니스 임팩트를 우선하는 분
- 문제 상황을 주도적으로 해결하고 다양한 팀과 원활하게 커뮤니케이션할 수 있는 분
[우대사항]
- MLflow, Airflow, Metaflow, Feature Store 등 MLOps 플랫폼을 구축하거나 운영해본 경험이 있는 분
- BentoML, Triton 등 모델 서빙 환경을 구축하고 운영해본 경험이 있는 분
- GPU를 활용한 모델 학습과 서빙 최적화를 수행해본 경험이 있는 분
- ML 모델의 성능을 모니터링하고 품질을 지속적으로 개선해본 경험이 있는 분
- 대규모 학습이나 고트래픽 환경에서도 모델 서빙 및 서비스를 안정적으로 운영해본 경험이 있는 분
- AWS, GCP 등 퍼블릭 클라우드 환경에서 인프라를 구축하고 운영해본 경험이 있는 분
- LLM 서빙 환경을 구축하거나 LLMOps 플랫폼을 운영해본 경험이 있는 분
[개발환경]
- 주요 기술 : Python, AWS, Kubernetes, MLflow, BentoML, Flink, Spark, Airflow, Kafka, DocDB, Redis, Elasticsearch
- 업무 도구 : GitLab, Jira, Confluence, Slack
- 빌드, 배포 자동화 : GitLab CI, ArgoCD
- 모니터링 : Prometheus, Grafana
[꼭 읽어 주세요!]
- 지원 시 경력기술서(PDF형식) 필수 첨부 부탁드립니다.
- 경력기술서는 그동안 수행하신 업무 중 실제 비즈니스에 임팩트를 준 프로젝트나 과제를 중심으로 구체적으로 작성해 주세요.
- 머신러닝 플랫폼 구축, 운영 경험, 그리고 운영 중 발생한 이슈에 대한 트러블슈팅 사례가 있다면 상세히 설명해 주세요.
- 어떤 문제를 해결했는지, 어떤 기술을 적용했는지, 결과적으로 어떤 개선 효과가 있었는지 중심으로 작성해 주시면, 지원자의 기술력과 문제 해결 역량을 더 정확하게 파악할 수 있습니다.
- 가능하다면 정량적인 수치나 지표(예: 처리량 개선, 배포 시간 단축, 운영 비용 절감 등)로 결과를 표현해 주세요. 단, 외부 공개가 민감한 정보일 경우 해당 내용은 생략하셔도 괜찮습니다.