주요 업무
- 네트워크 토폴로지 및 LPU 아키텍쳐를 고려한 Collective Communication 알고리즘 (e.g., All-reduce, Broadcast, All-gather, …) 설계, 개발 및 유지보수
- 딥러닝 프레임워크 (e.g., PyTorch Distributed) 에 통합 및 동작 확인
- 프로파일링 도구와 하드웨어 통찰력을 바탕으로 성능 병목 현상 식별, 분석 및 해결
- 벤치마크를 통한 성능 평가 및 개선
자격 요건
- CCL 에 대한 깊은 이해 및 숙련도
- 분산 시스템 개념, 동시성 및 동기화에 대한 이해
- C/C++ 에 대한 이해 및 숙련도
우대 사항
- NVIDIA NCCL, Open MPI 와 같은 라이브러리에 대한 실제 경험
- 딥러닝 프레임워크의 분산 패러다임(e.g., torch.distributed, tf.distribute)에 대한 이해
- 네트워크, PCIe 드라이버 또는 펌웨어 지식
채용 절차
서류 전형 ▶ 실무 면접 ▶ 임원 면접 ▶ (평판 조회) ▶ 최종 합격
* 채용 전형은 진행 상황에 따라 변경될 수 있으며, 변경 시 사전 안내 드립니다.
* 입사 후 3개월의 수습기간이 적용됩니다.
전문연구요원 신규 편입은 수습해제 이후 신청 가능합니다.(전직 대상자 제외)
기타 안내
[Office]- 강남 뱅뱅사거리 위치
- 음료/커피/스낵 지원
- 유연근무제
- 자유로운 연차 사용
- 라운지, 안마의자 등 휴식 공간
- 교육 및 도서 지원
- 건강검진 지원
- 복지포인트 지원
- 장기근속 포상
- 전사 올핸즈 미팅(월 1회)
- 전사 워크샵 (년 1회, 국내/해외)
- 동호회/스터디 지원
- 회식비 지원
고용형태
정규직
근무지
서울
서울특별시 서초구 강남대로 299, 4층
주요 업무
- 네트워크 토폴로지 및 LPU 아키텍쳐를 고려한 Collective Communication 알고리즘 (e.g., All-reduce, Broadcast, All-gather, …) 설계, 개발 및 유지보수
- 딥러닝 프레임워크 (e.g., PyTorch Distributed) 에 통합 및 동작 확인
- 프로파일링 도구와 하드웨어 통찰력을 바탕으로 성능 병목 현상 식별, 분석 및 해결
- 벤치마크를 통한 성능 평가 및 개선
자격 요건
- CCL 에 대한 깊은 이해 및 숙련도
- 분산 시스템 개념, 동시성 및 동기화에 대한 이해
- C/C++ 에 대한 이해 및 숙련도
우대 사항
- NVIDIA NCCL, Open MPI 와 같은 라이브러리에 대한 실제 경험
- 딥러닝 프레임워크의 분산 패러다임(e.g., torch.distributed, tf.distribute)에 대한 이해
- 네트워크, PCIe 드라이버 또는 펌웨어 지식
채용 절차
서류 전형 ▶ 실무 면접 ▶ 임원 면접 ▶ (평판 조회) ▶ 최종 합격
* 채용 전형은 진행 상황에 따라 변경될 수 있으며, 변경 시 사전 안내 드립니다.
* 입사 후 3개월의 수습기간이 적용됩니다.
전문연구요원 신규 편입은 수습해제 이후 신청 가능합니다.(전직 대상자 제외)
기타 안내
[Office]- 강남 뱅뱅사거리 위치
- 음료/커피/스낵 지원
- 유연근무제
- 자유로운 연차 사용
- 라운지, 안마의자 등 휴식 공간
- 교육 및 도서 지원
- 건강검진 지원
- 복지포인트 지원
- 장기근속 포상
- 전사 올핸즈 미팅(월 1회)
- 전사 워크샵 (년 1회, 국내/해외)
- 동호회/스터디 지원
- 회식비 지원
고용형태
정규직
근무지
서울
서울특별시 서초구 강남대로 299, 4층
기업 사정으로 조기 마감되거나 내용이 변경될 수 있습니다


