This position is open for candidates who reside in Korea and have a Korean proficiency appropriate for working in a Korean business.
"Conquering cancer through AI"
Lunit은 "Learning Unit"을 줄여 만든 이름으로, 암 진단 및 치료에 기여하는 인공지능 솔루션을 개발하고 제공하는 의료 AI 기업입니다.
루닛은 인공지능 기술을 통해 더 정확한 암 진단과 치료 효과 예측이 가능해지고, 환자를 위한 신속한 맞춤형 치료가 가능해지는 시대를 열고자 합니다.
💭 About the team
- What do we do? (Department Mission)
AI Platform Department는 전 세계 환자의 진단과 치료에 실제로 사용되는 의료 AI 모델이 안정적으로 동작하도록 데이터·학습·운영·서빙 전반을 아우르는 기반 플랫폼을 구축합니다. 우리는 기술을 통해 암의 조기 발견과 정확한 치료라는 목표에 기여하고자 합니다. - How do we work? (Work Style)
- 빠르게 시도하고 실사용자 피드백을 바탕으로 지속적으로 개선하는 개발 문화
- 문제 정의 단계부터 PM, AI 연구자, 엔지니어가 함께 참여하는 강한 협업 구조
- 품질을 지키면서 속도를 높이기 위해 AI 기반 개발·자동화 도구 적극 활용
- 명확한 설계와 코드 리뷰를 통한 투명한 기술 의사결정
- What kind of problems do we solve? (Design Philosophy)
- TB~PB 규모의 의료 데이터를 다루는 대규모 데이터 인프라 문제
- 데이터 보안·프라이버시 규제를 충족하는 엔터프라이즈 아키텍처
- 연구자가 수천 건의 실험을 수행할 수 있도록 지원하는 대규모 ML 파이프라인 자동화
- 글로벌 병원 인프라와 연결된 데이터 연동·모니터링 시스템
- Who will I spend 8+ hours/day with? (Co-workers)
- 글로벌 인재로 구성된 AI 연구자, SW 엔지니어, MLOps 엔지니어 등 전문성 높은 동료들
- 영어와 한국어가 자연스럽게 공존하는 팀 환경
- 서로의 지식과 배경을 존중하며 함께 성장하는 문화
- What kind of support do we offer? (Learning & Growth)
- 사내 영어 교육을 통한 원활한 글로벌 협업 지원
- 의료·AI·데이터·플랫폼 분야의 전문성을 넓힐 수 있는 환경
- 난이도 높은 문제를 다루며 빠르게 성장할 수 있는 구조
- Why do we do this? (Purpose)
- 우리가 구축하는 데이터 인프라와 파이프라인은 의료 AI 모델의 정확도·재현성·신뢰성을 결정하는 핵심 요소입니다.Data Engineer의 한 줄 코드, 하나의 파이프라인 개선은 결국 전 세계 환자의 진단 결과에 직접적인 영향을 미칩니다.
💭 About the position
- What will I build? (Scope of Work)
- 의료 데이터 수집·정제·변환 파이프라인
- AI 학습 데이터셋 생성 및 버전 관리 시스템
- 대규모 ML 워크플로우 자동화
- Data Lineage, Metadata, Quality 관리 체계
- 규제 및 보안이 중요한 의료 데이터 거버넌스 인프라
- 글로벌 SaaS 형태의 의료 AI 데이터 플랫폼
- What design/engineering challenges will I face? (Focus Area)
- PB 규모 의료 데이터 파이프라인 설계
- 멀티클라우드(AWS/GCP/Azure) 운영
- 의료 규제 준수와 자동화를 동시에 만족하는 구조 설계
- GPU 학습 환경과 연동되는 고성능 데이터 공급 문제 해결
- 제품–연구–엔지니어링 요구를 조율하는 협업 중심의 문제 해결
- What kind of engineer fits well here? (Ideal Profile)
- 데이터 시스템의 '전체 흐름'과 '구조'를 설계하는 일을 좋아하는 분
- 복잡한 문제를 구조화하고 실용적인 해결책을 제시할 수 있는 분
- Data Quality, Security, Lineage 에 높은 기준을 가진 분
- '의료 AI'라는 어려운 도메인에서 의미 있는 변화를 만들고 싶은 분
- How will I grow? (Opportunities)
- 복잡한 AI·데이터 시스템을 총괄적으로 설계하는 경험
- 글로벌 의료 AI SaaS 플랫폼 구축 경험
- Research, MLOps, Engineering이 맞물린 대규모 조직 구조에서의 성장
🚩 주요 업무
Senior Data Platform Engineer는 의료 AI 모델 개발에 필요한 대규모 의료 데이터를 안정적으로 수집, 저장, 가공, 탐색, 어노테이션, 배포할 수 있는 데이터 플랫폼을 설계하고 구현합니다.
- TB~PB 규모의 의료 영상·진단 데이터를 안정적으로 처리하기 위한 데이터 파이프라인을 설계·개발
- 데이터 수집–정제–변환–검증–배포까지 이어지는 End-to-End 데이터 워크플로우를 구축하여, AI 연구자와 MLOps 엔지니어의 생산성을 극대화
- 의료 데이터의 표준화, 품질 관리, 버전 관리, Lineage, Metadata 관리 등 신뢰할 수 있는 AI 학습 데이터 관리 체계를 구현
- AI 연구자와 의료 전문가가 데이터를 효율적으로 탐색, 검수, 어노테이션할 수 있는 데이터 플랫폼 기능과 도구형 Web UI를 개발
- 의료 규제와 프라이버시 요구사항을 고려해 데이터 접근 제어, 감사 추적, Governance 기능을 설계하고 구현
- AI 연구자, MLOps 엔지니어, 의료 전문가, 제품팀과 협업하여 실제 사용자의 문제를 해결하는 데이터 플랫폼 기능을 정의하고 개선
- AI 기반 개발도구(Cursor, Codex, ChatGPT, Claude Code 등)을 적극 활용해 파이프라인 생성·테스트·문서화의 생산성을 향상
🚩 Tech Stack
AI Platform Department는 AI를 활용해 품질을 유지하면서 생산성을 극대화하는 엔지니어링 문화를 지향합니다. Cursor, Codex, Claude Code 등 AI 개발 도구를 적극적으로 활용해 설계·구현·테스트 효율을 한 단계 끌어올리고 있습니다.
- Core Technologies
- Python & Go 기반 데이터·워크플로우 개발
- Prefect (orchestration) 기반 ETL/ML 파이프라인
- PostgreSQL, Iceberg, Trino, BigQuery
- Azure Blob Storage/GCS 기반 대용량 데이터 처리
- Kubernetes, Docker
- MLflow
- Security / Governance
- 의료 데이터 및 모델에 대한 Governance/Lineage
- RBAC 기반 안전한 데이터 접근
- 데이터 품질 검증 및 정책 기반 접근 관리
🎯 자격요건
- 데이터 플랫폼·파이프라인 설계 및 운영 경험이 있으신 분
- 데이터 플랫폼, 데이터 파이프라인 또는 백엔드 시스템 개발 분야에서 5년 이상의 실무 경험
- 데이터 수집부터 검증, 배포까지 이어지는 데이터 워크플로우를 구조화하고 자동화한 경험
- 데이터 파이프라인, 데이터 저장소, 데이터 관리 도구 중 하나 이상을 직접 설계하거나 개발한 경험
- Prefect, Airflow 등 Workflow Orchestrator 기반의 데이터 파이프라인을 설계·운영한 경험
- 대규모 데이터 저장·처리·서빙 경험이 있으신 분
- 대규모 데이터를 안정적으로 저장, 처리, 조회하는 시스템을 설계·구현한 경험
- 대용량 이미지 또는 파일 기반 데이터(수십 TB 이상)를 처리·서빙한 경험
- Azure Blob Storage, GCS 등 오브젝트 스토리지 기반의 대용량 데이터 저장소를 설계하거나 운영한 경험
- PostgreSQL 등 관계형 데이터베이스를 활용해 메타데이터·서비스 저장소를 설계·운영한 경험
- Iceberg/Trino, BigQuery 등 레이크하우스 또는 데이터 웨어하우스 기반의 대규모 분석 쿼리 시스템을 활용한 경험
- 데이터 품질 보안 거버넌스 관련 경험이 있으신 분
- 데이터 품질, 안정성, 보안, 접근 제어를 고려한 시스템 설계 역량
- 데이터셋, 메타데이터, 품질 검증, 버전 관리 등 신뢰할 수 있는 학습 데이터 관리 기능을 직접 설계·구현한 경험
- 다수의 서비스와 사용자가 공유하는 데이터 플랫폼의 API, 데이터 모델, 권한 모델을 설계한 경험
- 백엔드 및 시스템 구현 경험이 있으신 분
- Python, Go, Java 등 하나 이상의 언어로 서버 또는 데이터 처리 시스템을 설계·구현한 경험
- 복잡한 도메인 요구사항을 구조화하고, 이를 제품 기능이나 시스템 설계로 구체화할 수 있는 역량
- AI·의료 데이터 도메인 이해 및 학습 의지가 있으신 분
- 의료 데이터와 AI 모델 개발 도메인에 대한 관심 또는 학습 의지
- 협업 및 커뮤니케이션 역량이 있으신 분
- AI 연구자, 데이터 엔지니어, MLOps 엔지니어, 의료 전문가 등 다양한 직군과 협업할 수 있는 커뮤니케이션 역량
- 다양한 직군과 협업하여 문제를 정의하고 실행 가능한 해결 방향을 제시할 수 있는 커뮤니케이션 역량
- 기술 요구사항과 제품 요구사항을 조율하며 이해관계자와 협업한 경험
- 영어 기반 문서 작성 및 협업에 무리가 없는 영어 구사력
🏅 우대사항
- DICOM, 병리 이미지, PHI 등 의료 데이터 특성에 대한 이해가 있거나 학습 의지가 있으신 분
- AI 학습 데이터셋 생성, 어노테이션 도구, 데이터 검수 도구를 개발한 경험이 있으신 분
- 대규모 GPU 학습 환경과 연동되는 데이터 공급 파이프라인을 구축한 경험이 있으신 분
- 데이터 품질 지표, 자동화된 테스트, 데이터 검증 시스템을 구축한 경험이 있으신 분
- 의료 데이터 관련 개인정보보호법, HIPAA, EU AI Act 등 국내외 규제에 대한 이해를 바탕으로, 관련 요건을 충족하는 시스템을 설계하거나 구현한 경험이 있으신 분
- 클라우드 비용 최적화 경험이 있으신 분
- DataHub, Amundsen 등 데이터 카탈로그를 구축하거나 활용한 경험이 있으신 분
- 글로벌 팀 또는 영어 기반 협업 환경에서 일한 경험이 있으신 분
📝 제출서류
- 자유 양식의 이력서
- 포트폴리오 또는 기타 관련 자료(선택 사항)
🏃♀️ 전형 절차
- Document Screening → Competency-based Interview → Culture-fit Interview → Onboarding
- 최종 면접 이후, 필요 시 레퍼런스 체크를 진행할 수 있습니다.
🤝 근무 조건 및 근무 환경
- 근무형태 : 정규직 (수습 기간 3개월)
- 근무지역 : 루닛본사 (강남구 강남대로 374 케이스퀘어 강남2, 5층)
- 급여 : 면접 후 결정
🎸 기타사항
- 입사지원 서류에 허위사실이 발견될 경우, 채용확정 이후라도 채용이 취소될 수 있습니다.
- 국가 유공자 및 장애인 등 취업보호대상자는 관계법령에 따라 우대합니다.
- 본 공고는 수시 채용으로, 조기 마감될 수 있습니다.
🌻 Benefits & Perks
- 강남역 3번 출구 도보 1분 거리에 위치한 신규 오피스(언덕 없는 평지)
- 오피스 근무 시 12,000원의 식비 지원(점심, 저녁) 및 무제한 간식 제공
- 최신 사양의 컴퓨터 장비(Mac, 4K 모니터 등) 선택, 3년마다 최신형 장비 지원
- 학회 참석, 직무 교육, 도서 구매 지원
- 정규 사내 인공지능/의료 세미나 개최
- 원어민 영어 교육 프로그램 수강 지원
- 대규모 고품질 인공지능 학습 데이터 및 딥러닝 DevOps 시스템 보유
- 자유롭게 쓸 수 있는 복지 포인트 연간 120만원 지원
- 명절 선물 및 각종 경조사에 대한 경조사비와 경조휴가 지원
- 종합건강검진, 임직원 상해 보험 가입 등의 지원