◆ 직원 유형
정규직
◆ 영입인원
0 명
◆ 조직소개
우리 조직은 카카오의 자체 멀티모달 언어모델인 Kanana 시리즈를 연구 및 개발합니다.
이미지-텍스트를 이해하는 Kanana-v(비전 언어모델), 오디오-텍스트 입출력이 가능한 Kanana-a(오디오 언어모델), 다양한 모달리티의 입출력을 통합하는 Kanana-o(멀티모달 통합 언어모델)을 개발하고 있습니다.
모든 형태의 입력과 출력 간 자유로운 상호 이해가 가능한 범용 멀티모달 모델 개발을 목표로, 국내외 최신 연구 동향을 빠르게 분석하고 이를 바탕으로 기술 선도 수준의 모델을 확보하고자 합니다.
◆ 업무내용
- 이미지, 오디오, 텍스트 등 다양한 모달리티을 다루는 Multimodal LLM 연구 및 개발
- Supervised Fine-tuning(SFT) 및 Human Preference Alignment 를 통한 instruction-following 성능 및 모델 안전성 향상
- 단순 응답부터 복합 reasoning 까지 아우르는 추론 성능 향상 모델링
- 대규모 분산 학습 환경에서의 모델 학습 코드 개발 및 성능 최적화
- 멀티모달 학습을 위한 고품질 데이터 수집, 전처리, 정합성 확보 및 구축 파이프라인 설계
- 멀티모달 모델의 평가 지표 설계 및 벤치마킹, 실사용 시나리오 기반의 성능 검증
◆ 지원자격
- 딥러닝 관련 분야 석사 이상 또는 이에 준하는 관련 경력이 2년 이상인 분
- 주요 딥러닝 프레임워크(PyTorch, TensorFlow, JAX 등) 중 하나 이상을 활용한 경험이 있는 분
- Python 기반의 코드 개발 및 실험 구현에 능숙한 분
◆ 우대사항
- Multimodal LLM 기술 및 관련 서비스 개발 경험이 있는 분
- CVPR, NeurIPS, ICLR, ICCV, ICML 등 AI 분야 최상위 학회 논문 발표 또는 공동 연구 경험이 있는 분
- ACM ICPC 등 주요 프로그래밍 대회 수상 경력 또는 이에 준하는 알고리즘 솔빙 역량을 보유한 분
◆ 지원프로세스
서류전형(CV 또는 프로젝트 경력 pdf파일 또는 url 첨부 필수) > 코딩테스트 > 사전인터뷰 > 1차 인터뷰(사전과제) > 2차 인터뷰 > 처우 협의 > 최종 합격 및 입사
※ 영입 진행 상황에 따라 전형이 추가/변경될 수 있습니다.
◆ 크루의 한마디
< 우리가 일하는 방식 >
- 우리는 자율성과 책임감을 바탕으로 함께 일하는 문화를 만들어갑니다.
- 회사의 공통 원칙을 존중하면서도, 개인의 몰입과 팀의 효율을 극대화할 수 있는 방식으로 유연하게 일합니다.
- 불필요한 보고나 형식보다 실질적인 성과와 성장에 집중하며, 스스로 목표를 세우고 실행하는 과정을 중요하게 생각합니다.
- 지속적인 기술 공유와 수평적인 커뮤니케이션을 통해 함께 배우고 성장하는 문화를 만들어갑니다.
연구부터 프로덕트 응용까지, 기술의 전 과정을 함께 고민하고 주도해 나갈 열정적인 분들을 기다립니다.
◆ 근로제도
• 완전선택근무제
해당 포지션은 월 총 근무시간 범위 내에서 크루 스스로 하루의 업무 시작 및 종료 시간을 설정하여 자율적으로 몰입하여 근무할 수 있는 <완전선택근무제>를 적용받습니다.
• 월 1일 리커버리데이
매월 마지막 주 금요일은 크루의 휴식과 충전을 위한 <리커버리데이>로 운영됩니다.
• 주 1일 원격근무
업무와 협업의 효율성을 우선으로 하여, 리커버리데이가 없는 주에는 <주 1일 원격근무>가 가능합니다.