직무 개요
본 포지션은 Agentic AI 플랫폼을 위한 백엔드, 데이터 플랫폼, MLOps, Cloud/On-prem 인프라, 그리고 보안까지 아우르는 End-to-End 플랫폼 엔지니어 역할을 수행합니다.
처음부터 모든 영역을 깊이 있게 아실 필요는 없습니다. 실무를 통해 아래 내용들을 전반적으로 숙지하며 특정 분야의 전문성(Specialty)을 키우고, 궁극적으로는 시스템의 경계를 넘나들며 주도적으로 문제를 정의하고 해결할 수 있는 엔지니어를 찾습니다.
주요 업무
- Agent 및 Workflow 기반 AI 플랫폼의 백엔드 서버 개발 및 운영
- 트래픽 및 비동기 워크로드를 고려한 API 및 워커 시스템 설계·구현
- 클라우드 및 온프레미스 환경에서의 서비스 배포, 운영, 자동화
- 정형/비정형 데이터 ingestion, 저장, 조회, 분석 파이프라인 구축 및 개선
- 워크플로우 운용: Temporal, Airflow
- 데이터 플랫폼: Clickhouse, Snowflake / Databricks, Postgres, Vector DB, NATS 등
- GPU 기반 모델 서빙 및 ML 워크로드를 위한 인프라 구성 및 운영서비스 안정성을 위한 모니터링, 로깅, 장애 대응
- 컴퓨팅 인프라: AWS 및 Neocloud (Nebius 등) 기반 GPU 인프라 (H100, B200 운용 및 보유중. 확장 예정)
- GPU 기반 인프라: SkyPilot, Ray, SGLang, vLLM 등
- 모니터링: OpenTelemetry, Grafana
- 엔터프라이즈 환경을 고려한 보안, 권한, 멀티테넌시 구조 설계고객 환경(On-prem / Hybrid Cloud)에 대한 배포 및 운영 이슈 해결
자격 요건
- 백엔드 구현 편의가 아닌, 실제 사용자의 경험과 제품 목표를 기준으로 시스템을 설계하는 자세
- 영어 기술 문서를 읽고 레퍼런스를 기반으로 문제를 해결할 수 있는 능력
- 웹 서버 및 아키텍처 설계 경험 (Python 선호)
- 필요시 Golang, Typescript, Rust 등 다양한 언어를 다룰 수 있는 의지
- 다양한 Workflow 시스템에 대한 경험 (Temporal, Airflow, Celery 등)
- REST HTTP 이외의 다양한 프로토콜 및 분산시스템 분석 능력
- 클라우드 인프라 구축 및 관리 경험 (AWS, GCP, Azure 중 하나 이상)
- 데이터베이스 설계 및 성능 최적화 경험 (SQL, NoSQL)
- CI/CD 파이프라인 구축 및 관리 경험
- 코딩 에이전트를 이용한 문제해결 능력
우대 사항
- 오픈소스 프로젝트 기여 경험
- 데이터 파이프라인 및 Columnar DB 운영 경험
- GPU 기반 ML 또는 모델 서빙 인프라 구축 경험
- Kubernetes, IaC, Observability 중심의 운영 경험
- Untrusted code 실행을 위한 Sandbox 환경 구축 경험 (예: Container, VM 환경 기반)
- SOC 2 Type II, ISO 27001 인증 대응 경험