합류하게 될 팀에 대해 알려드려요
- 토스의 DevOps Engineer는 Server Developer와 함께 SRE & DevOps팀에 속해 있어요.
- DevOps를 위한 여러 기술과 툴을 적용해서 개발자들이 서비스를 손쉽게 배포할 수 있도록 배포 과정을 혁신해요.
- 장애 발생 시 근본적인 원인을 파악할 수 있는 직관적인 메트릭을 도출하여, 모든 개발자가 신속하게 장애에 대응할 수 있는 탄탄한 시스템을 함께 구축해요.
- Kubernetes와 Cloud Native 에코 시스템을 적극적으로 활용해서 대규모 시스템을 고도화해요.
합류하면 함께할 업무예요
- 작년까지는 운영 경험을 개선하는 일에 집중했다면, 최근에는 개발 경험에 피로를 주거나, 비효율적이라고 생각되는 퍼널을 제거하는 것에 집중하고 있어요.
- 모니터링 및 장애 대응, 트러블 슈팅 업무를 담당해요.
- 개발자의 업무 경험을 지속적으로 분석하고 프로세스의 개발과 운영, 고도화 작업을 담당해요.
이런 분과 함께하고 싶어요
- 메인 업무 중 하나가 컨테이너 오케스트레이션과 관련되어 있기 때문에 관련 경험이 있으면 좋아요.
- 가장 어려운 부분이 네트워크 트러블슈팅이므로, 이러한 문제를 해결해본 경험이 있는 분과 함께하고 싶어요.
- 현재 속한 조직에서 엔지니어링 경험을 자동화하거나, 툴을 만들어서 개선해본 경험이 필요해요.
- 토스는 일을 누군가에게 지시하는 것이 아니라, 목표를 위해 각자 협업하며 업무하고 있어요. 그동안의 엔지니어링 경험을 통해 좋지 않는 퍼널을 제거할 수 있는 시야를 가지고 있으면 좋아요.
이력서는 이렇게 작성하시는 걸 추천해요
- Kubernetes + Istio 기반의 인프라 운영 경험을 작성해 주시면 좋아요.
- 대규모 분산 환경에서 메트릭 시스템을 구축하고 운영한 경험을 적어주시면 좋아요.
- 컨테이너 기반의 서비스와 CI/CD 서버 운영 경험을 적어주시면 좋아요.
- AWS 클라우드 서비스 운영 경험을 적어주시면 좋아요.
토스에서 사용하는 기술
- Java Spring Framework, JPA/Hibernate, Gradle
- Jenkins, Git, Docker, Kubernetes + Istio
- Kafka, Elastic, InfluxData, Grafana, Memcached
토스로의 합류 여정
- 서류 접수 > 1차 직무 인터뷰 > 2차 직무 인터뷰 > 문화적합성 인터뷰 > 레퍼런스 체크 > 처우협의 > 최종합격 및 입사
- 1차 직무 인터뷰는 질의응답의 형태로 약 30분 정도 진행됩니다.
함께할 동료를 위한 한마디
"자부심 넘치는 토스만의 탄탄한 시스템"
- 저는 DevOps Engineer로서 Kubernetes 와 Cloud Native 에코 시스템을 적극적으로 활용해서 대규모 시스템을 고도화하고 있어요.
- 토스는 서비스를 새롭게 설계하고 모던 시스템을 도입할 수 있는 기회가 풍부해요. 장애 발생 시 근본적인 원인을 파악을 위해 직관적인 메트릭을 도출할 수도 있어요.
- 이러한 환경 덕분에 모든 개발자가 신속하게 장애에 대응할 수 있는 탄탄한 시스템을 만들 수 있다는 것이 만족스러워요.
토스 DevOps Team과의 캐주얼챗에서 주로 나오는 질문들
Q. 토스에서는 devops, SRE(사이트 신뢰성 엔지니어링), SE(시스템 엔지니어링) 간의 업무 분담과 협업 구조가 어떻게 되나요?
- A. 토스는 IDC에서 서비스운영을 하기 때문에, 하드웨어나 커널관리부터 어플리케이션영역까지 넒은 영역을 운영하고 있어요. 여기서 하드웨어나 커널관리는 SE분들이 담당해주시고, devops는 해당 하드웨어에 올라가는 소프트웨어 영역들을 모두 책임지고 운영해요. 그리고 SRE분들은 서비스 이슈나 장애에 관해서 근본적인 원인을 분석하고 문제정의에 집중을 하고, devops는 해당 근본적인 원인과 문제정의를 바탕으로 해결방법에 대해서 고민하고 자동화된 플랫폼을 만드는데 집중해요.
Q. 토스는 금융권이면서도 큰 IDC를 운영하고, 클라우드에 대한 역량을 요하는 것 같은데, devops 엔지니어는 어떤 기술 역량과 중점 사항들이 있나요?
- A. devops는 여러 오픈소스와 자동화 플랫폼을 만들기 때문에, 개발능력이 필수적이고, 다루는 오픈소스의 종류가 많다 보니깐 해당 오픈소스의 문제영역을 정의해서 오픈소스를 고치고 운영하실 수 있는 역량을 중점적으로 보고 있어요. 그리고 주로 서버 엔지니어분들을 대상으로 생산성과 편리성, 운영들을 고민하기 때문에 서버 엔지니어로 일을 해보신 경험이 있으시면 좋아요.
Q. 토스에서 데브옵스 팀 규모와 다른 계열사에서도 데브옵스를 채용하는 것 같은데, 어떤 방식으로 협업을 하나요?
- A. 토스는 슈퍼 앱으로 서비스하고 있기 때문에, 운영을 잘하기 위해서는 계열사 간의 협업이 필수적이에요. 그래서 계열사별로 데브옵스 팀이 존재하고, 적게는 2~3명에서 많게는 5명까지 있어요. 하지만 구성은 모두 kubernetes와 istio, Prometheus 등 모두 같은 스택을 사용하고 있고, 노하우도 최대한 공유해서 운영하려고해요. 그래서 운영이나 문제해결관점에서 각자 다양한 인사이트를 얻을 수 있는데, 해당 인사이트를 2주 간격의 위클리에서 공유하고 업무효율을 높이고 시너지를 내고 있어요.
Q. 금융권에서 일할 때 마주치게 되는 제약사항과 그로 인한 업무환경이 어떻게 되나요?
- A. 금융서비스를 운영하다보니깐 전자금융감독규정을 지키고, 실질적인 보안을 높이면서 개발자분들의 생산성도 챙기려고 많은 노력들을 하고 있어요. 이것은 단순한 제약이라고 보기보다는 데브옵스 플랫폼에서 보안을 더 높이기 위한 새로운 목표에 가까운거 같아요. 물론 작업속도를 저해하는 부분들도 있지만 보안엔지니어분들과 최대한 협업하면서 해결하고, 더 편리하고 안전하게 만들방법이 없을지 치열하게 고민하고 개선하고 있어요.
Q. 토스는 devops 엔지니어가 기술 도입과 검증하는 프로세스가 어떻게 되나요?
- A. 토스의 데브옵스도 최대한 린스타트업 정신으로 일하려고 해요. 작게 실험하고 측정하면서 가설들을 검증하고 있어요. 현재 우리에게 어떤 문제가 있고, 그 문제를 해결하기 위한 가설은 어떤것이 있고, 그걸 작게 실험해서 측정해보고, 가설이 검증되면 전체배포를 빠르게 하여 시스템을 개선합니다. 이를 기반하기 위해서는 두가지가 필요한거 같습니다. 첫번째로는 시스템이 변화에 민첩하고 안전하게 바꿀 수 있는 구조가 갖춰져야 하고, 두번째로는 해당 가설검증하기 위한 observability가 갖춰져야 되는거 같아요. 그래서 과거부터 위에 두가지는 최대한 확보하려고 노력하고 있고, 지금도 부족한 부분에 대해서는 채우려고 노력하고 있어요.