리얼월드(RLWRLD)|Reinforcement Learning Research Engineer

**리얼월드(RLWRLD)**는 로봇이 인간처럼 세상을 인식하고 사고하며 손을 써서 작업할 수 있도록, 로보틱스 파운데이션 모델(Robotics Foundation Model)을 개발하고 있는 대한민국 최고의 AI 및 로보틱스 연구진이 이끄는 Physical AI 선도 기업입니다.

AI와 로보틱스 분야에서 축적한 깊은 연구 역량을 바탕으로, 고자유도 로봇 손의 섬세한 조작을 가능케 하는 범용 AI 모델을 빠르게 발전시키고 있고, 또한 연구소 및 로봇·센서 솔루션 파트너들과의 강력한 네트워크를 통해 제조업 등 실제 산업 현장에서 즉각적인 시장 적용이 가능한 AI 솔루션을 개발하고 있습니다.

최근 국내외 유수의 VC와 대기업으로부터 약 210억 원 규모의 시드 투자를 유치하며 대한민국 스타트업 역사상 최대 규모의 시드 투자를 기록한 리얼월드에는 AI와 로보틱스의 최전선 글로벌 기술 혁신을 경험하고자 하는 뛰어난 인재들이 속속 합류하고 있습니다.



[언론 보도]


조직 소개

RLWRLD 의 프로덕트 조직은 RLWRLD 의 모든 프로덕트를 개발하는 부서로, 기획/개발/연구의 모든 것을 책임집니다.

RLWLRD의 근간이 될 Robot Foundation Model과 해당 모델을 api/sdk화 하여 제공하는 역할은 물론, 데이터의 수집과 정제, 가공을 할 수 있는 텔레오퍼레이션과 데이터 파이프라인, 모델 학습을 위한 Training system, 모델의 기능과 성능을 테스트하는 Benchmark, 로봇을 실제로 제어하는 Robot control system, GPU 등 인프라를 균형있게 제공하는 Infra system 등이 주요 프로덕트입니다.

이를 위해 Research engineer, Software engineer 등으로 구성되어 있고, 모델을 주로 개발하느냐, 소프트웨어를 주로 개발하느냐 정도의 차이일 뿐, 그 경계가 아주 선명하지는 않습니다.

특히 Robot Foundation Model 을 개발하기 위해 Academy Researcher 들과 강결합되어 함께 Research하고, Robot Hands, Sensor 개발 파트너들과 협업하고, 회사 내부에서는 Business Developer와 긴밀하게 협업합니다.


포지션명

Reinforcement Learning Research Engineer


포지션 소개

혁신적인 인공지능 기반 로봇 제어 모델을 개발하고 적용할 수 있는 인재를 찾고 있습니다. 본 포지션은 로봇의 동작, 외형, 센서 인터랙션 등 복합적인 시스템 요소를 AI 모델링 기법으로 구현하여, 실제 환경에서의 최적 성능을 달성하는 데 기여하게 됩니다. 나아가 차세대 로보틱스 시스템에서 요구되는 고성능 모델 아키텍처 설계 및 최적화를 통해, 실제 로봇이 보다 지능적이고 효율적으로 학습·동작할 수 있는 기반을 마련하는 핵심 역할을 담당합니다.

미래 로보틱스 혁신의 중심에서, 당신의 창의력과 전문성이 빛날 기회를 만나보세요. 함께 도전하며 성장할 여러분을 기다립니다!


주요 업무

  • VLA 모델에 적용 가능한 강화학습 알고리즘 연구·개발
    • 표현력이 높은 diffusion/flow matching/auto-regressive 기반 VLA 모델에 효과적으로 강화학습을 적용하기 위한 알고리즘 연구
    • Imitation learning 만으로는 어려운 behavior를 효율적으로 학습시키는 강화학습 방법 연구
  • Offline-to-online RL을 통한 VLA 개선
    • 기존에 수집한 offline data를 최대한 활용하는 offline-to-online 세팅에서 sample efficient 알고리즘 연구
    • Offline-to-online RL을 모델 개발에 효율적으로 적용하기 위한 파이프라인 개발
  • Manipulation task에 적합한 reward model 연구 개발
    • 멀티 모달 데이터 환경에서 복합적인 task의 성공적으로 풀기 위한 최적의 reward model 연구·개발
  • 연구 결과 검증 및 협업
    • 시뮬레이션 및 실제 로봇 환경에서 모델의 성능을 종합적으로 테스트하고 분석
    • 로봇 시스템 엔지니어, 소프트웨어 엔지니어 등 유관 부서와 협업하여 통합 구현 및 개선사항 도출


자격 요건

  • 탄탄한 머신러닝/딥러닝 지식
    • Neural Network, CNN/RNN, Transformers, Diffusion 등 핵심 모델 구조에 대한 이해와 실무 활용 능력
  • VLA 또는 VLM 모델 연구·개발 경험
    • 멀티모달 데이터(비전·언어·동작)를 결합한 모델 설계 및 구현 능력
  • Imitation Learning 및 강화학습(RL) 이해
    • 모방 학습 알고리즘(DAgger, Behavior Cloning 등), RL 알고리즘(Q-learning, Policy Gradients 등) 적용 경험
    • 시뮬레이션 및 실제 환경에서의 정책 학습 경험
  • 프로그래밍 역량
    • Python, C++ 등 프로그래밍 언어를 활용한 로보틱스 AI 모델 개발 및 최적화 능력
    • Git 등 버전 관리 시스템 활용 능력
  • 분산·병렬 학습 환경 경험
    • GPU 클러스터 또는 HPC 환경에서 대규모 모델 학습을 진행하고 최적화한 경험


우대사항

  • 로보틱스 또는 자율주행 프로젝트 경험
    • ROS, 시뮬레이션 툴(MuJoCo, Gazebo 등)을 활용한 실제 로봇/가상 환경에서의 모델 통합 경험
  • 데이터 파이프라인 및 MLOps 경험
    • 데이터 관리, 모델 서빙, CI/CD 등 머신러닝 라이프사이클 자동화 경험
  • 수학/통계학적 분석 역량
    • 확률 이론, 최적화 이론, 강화학습 수학적 기초 등에 대한 이해
  • 논문 작성 및 학술대회 발표 경험
    • Top-tier 학회/저널(ICRA, IROS, NeurIPS 등)에 로보틱스 AI 관련 논문 게재 또는 발표 경험


근무 조건

근무장소 : 서울 강남구 선릉로 561 (역삼동, 루비나빌딩)

근무기간 : 정규직


수습 기간 안내

입사 시 3개월의 수습 기간이 적용됩니다.

수습 기간 동안 근무 태도와 역량 평가를 진행하며, 평가 결과에 따라 수습 기간이 연장되거나 채용이 취소될 수 있습니다.


지원 방법

메일 제목 : 리얼월드 [포지션명] 지원_[이름]

제출서류 :

  • 이력서 (한글 또는 영문)
  • (선택) 본인의 역량을 보여줄 수 있는 포트폴리오, 연구자료, 프로젝트 자료 등 추가 제출 가능


전형 절차

  • 서류 전형 > 1차 인터뷰 > 2차 인터뷰 > 3차 인터뷰 > 최종 합격
  • 서류 전형 합격 시 개별적으로 연락이 진행될 예정입니다.
  • 절차 상 필요한 경우 커피챗·코딩테스트가 포함될 수 있습니다.


RLWRLD is a leading Physical AI company founded by Korea’s top AI and robotics researchers, developing a Robotics Foundation Model that enables robots to perceive, reason, and manipulate the physical world like humans.

With deep expertise in AI and robotics, RLWRLD is rapidly advancing a universal AI model capable of high-precision manipulation using multi-degree-of-freedom robotic hands. Through a strong network of research labs and robotics/sensor solution partners, we are building AI solutions that can be immediately applied to real-world industrial settings such as manufacturing.

Recently, RLWRLD raised approximately KRW 21 billion (USD 14.4 million) in one of the largest seed funding rounds in Korean startup history, backed by top domestic and global VCs and corporations. Talented individuals from around the world are joining us to push the frontiers of AI and robotics innovation.


About the Product Organization

At RLWRLD, our Product Organization is responsible for developing all core products — spanning planning, development, and research.

We are building foundational technologies such as:

  • Robot Foundation Model (RFM)
  • APIs/SDKs to deliver RFM functionality
  • Data pipeline & teleoperation tools
  • Training systems for model learning
  • Benchmark systems to test performance
  • Robot control systems
  • Infra stack (GPU orchestration, compute management)

Our team includes both research and software engineers, working fluidly across AI model development and software infrastructure. We collaborate closely with Academy Researchers, robotic hardware partners, and internal business developers to deliver cutting-edge robotics solutions.


Position Overview

We are seeking talented individuals to develop and apply innovative AI-based robot control models. This role involves designing AI-driven systems that model complex robotic components—including motion, physical form, and sensor interactions—to optimize real-world performance. You will play a key role in designing and optimizing high-performance model architectures required by next-generation robotic systems, enabling intelligent and efficient learning and behavior in physical robots.

Join us at the forefront of robotics innovation—where your creativity and expertise will drive the future. We look forward to growing together with you!


Key Responsibilities

  • Research and Development of VLA and Action Generation Models
    • Design model architectures that integrate visual (image/video), language, and robotic action data
    • Apply and optimize deep learning techniques for effective multimodal information processing
  • Imitation Learning–based Model Development
    • Develop algorithms that learn robotic control policies from demonstration data
    • Design data collection, preprocessing pipelines, and model evaluation processes
  • Reinforcement Learning (RL)–based Policy Training
    • Improve robotic control performance using RL algorithms (policy-based, value-based methods, etc.)
    • Research algorithms that enhance learning efficiency and stability in both simulation and real-world environments
  • Large-scale Model Training and Optimization
    • Conduct large-scale model training and hyperparameter optimization using high-performance computing (HPC) or GPU clusters
    • Maximize training speed and accuracy through parallel and distributed learning frameworks
  • Model Validation and Cross-functional Collaboration
    • Test and analyze model performance comprehensively in both simulated and real robotic environments
    • Collaborate with robotic system engineers, software engineers, and related teams to achieve integrated implementation and continuous improvement


Required Qualifications

  • Strong Knowledge in Machine Learning / Deep Learning
    • Understanding and practical experience with neural networks, CNN/RNN, Transformers, etc.
  • Experience in VLA or VLM Model Development
    • Ability to design and implement models that combine multimodal data (vision, language, motion).
  • Understanding of Imitation Learning & Reinforcement Learning
    • Experience applying algorithms such as DAgger, Behavior Cloning, Q-learning, and Policy Gradients.
    • Practical knowledge of training policies in both simulation and real-world settings.
  • Programming Skills
    • Proficiency in Python and/or C++ for developing and optimizing robotics AI models.
    • Experience with version control tools like Git.
  • Distributed / Parallel Training Experience
    • Hands-on experience training large models in GPU clusters or HPC environments and optimizing their performance.


Preferred Qualifications

  • Experience in Robotics or Autonomous Driving Projects
    • Experience integrating models into real or simulated environments using ROS and tools like MuJoCo, Gazebo.
  • Experience with Data Pipelines and MLOps
    • Experience in automating machine learning workflows, including data handling, model serving, and CI/CD.
  • Mathematical & Statistical Analysis Skills
    • Solid understanding of probability theory, optimization, and mathematical foundations of reinforcement learning.
  • Research & Publication Experience
    • Publications or presentations on robotics AI at top-tier conferences/journals such as ICRA, IROS, or NeurIPS.


Working Conditions

  • Work Location: 561 Seolleung-ro, Gangnam-gu, Seoul (RUBINA Building, Yeoksam-dong)
  • Employment Type: Full-time
  • Probationary Period A three-month probationary period will apply upon employment. During this period, your work attitude and performance will be evaluated. Depending on the evaluation results, the probationary period may be extended or the employment offer may be withdrawn.


How to Apply

  • Email Subject: RLWRLD [Position Title] Application_[Your Name]
  • Application Materials:
    • Resume in English or Korean
    • (optional) Portfolio, research materials, or project documents showcasing your capabilities
  • Application Deadline: Rolling basis


Recruitment Process

  • Resume Screening → First Round Interview → Second Round Interview → Final Interview → Offer
  • Candidates who pass the document screening will be contacted individually.
  • Additional Coffee Chats or Coding Test may be conducted if necessary.
지원하러 가기

**리얼월드(RLWRLD)**는 로봇이 인간처럼 세상을 인식하고 사고하며 손을 써서 작업할 수 있도록, 로보틱스 파운데이션 모델(Robotics Foundation Model)을 개발하고 있는 대한민국 최고의 AI 및 로보틱스 연구진이 이끄는 Physical AI 선도 기업입니다.

AI와 로보틱스 분야에서 축적한 깊은 연구 역량을 바탕으로, 고자유도 로봇 손의 섬세한 조작을 가능케 하는 범용 AI 모델을 빠르게 발전시키고 있고, 또한 연구소 및 로봇·센서 솔루션 파트너들과의 강력한 네트워크를 통해 제조업 등 실제 산업 현장에서 즉각적인 시장 적용이 가능한 AI 솔루션을 개발하고 있습니다.

최근 국내외 유수의 VC와 대기업으로부터 약 210억 원 규모의 시드 투자를 유치하며 대한민국 스타트업 역사상 최대 규모의 시드 투자를 기록한 리얼월드에는 AI와 로보틱스의 최전선 글로벌 기술 혁신을 경험하고자 하는 뛰어난 인재들이 속속 합류하고 있습니다.



[언론 보도]


조직 소개

RLWRLD 의 프로덕트 조직은 RLWRLD 의 모든 프로덕트를 개발하는 부서로, 기획/개발/연구의 모든 것을 책임집니다.

RLWLRD의 근간이 될 Robot Foundation Model과 해당 모델을 api/sdk화 하여 제공하는 역할은 물론, 데이터의 수집과 정제, 가공을 할 수 있는 텔레오퍼레이션과 데이터 파이프라인, 모델 학습을 위한 Training system, 모델의 기능과 성능을 테스트하는 Benchmark, 로봇을 실제로 제어하는 Robot control system, GPU 등 인프라를 균형있게 제공하는 Infra system 등이 주요 프로덕트입니다.

이를 위해 Research engineer, Software engineer 등으로 구성되어 있고, 모델을 주로 개발하느냐, 소프트웨어를 주로 개발하느냐 정도의 차이일 뿐, 그 경계가 아주 선명하지는 않습니다.

특히 Robot Foundation Model 을 개발하기 위해 Academy Researcher 들과 강결합되어 함께 Research하고, Robot Hands, Sensor 개발 파트너들과 협업하고, 회사 내부에서는 Business Developer와 긴밀하게 협업합니다.


포지션명

Reinforcement Learning Research Engineer


포지션 소개

혁신적인 인공지능 기반 로봇 제어 모델을 개발하고 적용할 수 있는 인재를 찾고 있습니다. 본 포지션은 로봇의 동작, 외형, 센서 인터랙션 등 복합적인 시스템 요소를 AI 모델링 기법으로 구현하여, 실제 환경에서의 최적 성능을 달성하는 데 기여하게 됩니다. 나아가 차세대 로보틱스 시스템에서 요구되는 고성능 모델 아키텍처 설계 및 최적화를 통해, 실제 로봇이 보다 지능적이고 효율적으로 학습·동작할 수 있는 기반을 마련하는 핵심 역할을 담당합니다.

미래 로보틱스 혁신의 중심에서, 당신의 창의력과 전문성이 빛날 기회를 만나보세요. 함께 도전하며 성장할 여러분을 기다립니다!


주요 업무

  • VLA 모델에 적용 가능한 강화학습 알고리즘 연구·개발
    • 표현력이 높은 diffusion/flow matching/auto-regressive 기반 VLA 모델에 효과적으로 강화학습을 적용하기 위한 알고리즘 연구
    • Imitation learning 만으로는 어려운 behavior를 효율적으로 학습시키는 강화학습 방법 연구
  • Offline-to-online RL을 통한 VLA 개선
    • 기존에 수집한 offline data를 최대한 활용하는 offline-to-online 세팅에서 sample efficient 알고리즘 연구
    • Offline-to-online RL을 모델 개발에 효율적으로 적용하기 위한 파이프라인 개발
  • Manipulation task에 적합한 reward model 연구 개발
    • 멀티 모달 데이터 환경에서 복합적인 task의 성공적으로 풀기 위한 최적의 reward model 연구·개발
  • 연구 결과 검증 및 협업
    • 시뮬레이션 및 실제 로봇 환경에서 모델의 성능을 종합적으로 테스트하고 분석
    • 로봇 시스템 엔지니어, 소프트웨어 엔지니어 등 유관 부서와 협업하여 통합 구현 및 개선사항 도출


자격 요건

  • 탄탄한 머신러닝/딥러닝 지식
    • Neural Network, CNN/RNN, Transformers, Diffusion 등 핵심 모델 구조에 대한 이해와 실무 활용 능력
  • VLA 또는 VLM 모델 연구·개발 경험
    • 멀티모달 데이터(비전·언어·동작)를 결합한 모델 설계 및 구현 능력
  • Imitation Learning 및 강화학습(RL) 이해
    • 모방 학습 알고리즘(DAgger, Behavior Cloning 등), RL 알고리즘(Q-learning, Policy Gradients 등) 적용 경험
    • 시뮬레이션 및 실제 환경에서의 정책 학습 경험
  • 프로그래밍 역량
    • Python, C++ 등 프로그래밍 언어를 활용한 로보틱스 AI 모델 개발 및 최적화 능력
    • Git 등 버전 관리 시스템 활용 능력
  • 분산·병렬 학습 환경 경험
    • GPU 클러스터 또는 HPC 환경에서 대규모 모델 학습을 진행하고 최적화한 경험


우대사항

  • 로보틱스 또는 자율주행 프로젝트 경험
    • ROS, 시뮬레이션 툴(MuJoCo, Gazebo 등)을 활용한 실제 로봇/가상 환경에서의 모델 통합 경험
  • 데이터 파이프라인 및 MLOps 경험
    • 데이터 관리, 모델 서빙, CI/CD 등 머신러닝 라이프사이클 자동화 경험
  • 수학/통계학적 분석 역량
    • 확률 이론, 최적화 이론, 강화학습 수학적 기초 등에 대한 이해
  • 논문 작성 및 학술대회 발표 경험
    • Top-tier 학회/저널(ICRA, IROS, NeurIPS 등)에 로보틱스 AI 관련 논문 게재 또는 발표 경험


근무 조건

근무장소 : 서울 강남구 선릉로 561 (역삼동, 루비나빌딩)

근무기간 : 정규직


수습 기간 안내

입사 시 3개월의 수습 기간이 적용됩니다.

수습 기간 동안 근무 태도와 역량 평가를 진행하며, 평가 결과에 따라 수습 기간이 연장되거나 채용이 취소될 수 있습니다.


지원 방법

메일 제목 : 리얼월드 [포지션명] 지원_[이름]

제출서류 :

  • 이력서 (한글 또는 영문)
  • (선택) 본인의 역량을 보여줄 수 있는 포트폴리오, 연구자료, 프로젝트 자료 등 추가 제출 가능


전형 절차

  • 서류 전형 > 1차 인터뷰 > 2차 인터뷰 > 3차 인터뷰 > 최종 합격
  • 서류 전형 합격 시 개별적으로 연락이 진행될 예정입니다.
  • 절차 상 필요한 경우 커피챗·코딩테스트가 포함될 수 있습니다.


RLWRLD is a leading Physical AI company founded by Korea’s top AI and robotics researchers, developing a Robotics Foundation Model that enables robots to perceive, reason, and manipulate the physical world like humans.

With deep expertise in AI and robotics, RLWRLD is rapidly advancing a universal AI model capable of high-precision manipulation using multi-degree-of-freedom robotic hands. Through a strong network of research labs and robotics/sensor solution partners, we are building AI solutions that can be immediately applied to real-world industrial settings such as manufacturing.

Recently, RLWRLD raised approximately KRW 21 billion (USD 14.4 million) in one of the largest seed funding rounds in Korean startup history, backed by top domestic and global VCs and corporations. Talented individuals from around the world are joining us to push the frontiers of AI and robotics innovation.


About the Product Organization

At RLWRLD, our Product Organization is responsible for developing all core products — spanning planning, development, and research.

We are building foundational technologies such as:

  • Robot Foundation Model (RFM)
  • APIs/SDKs to deliver RFM functionality
  • Data pipeline & teleoperation tools
  • Training systems for model learning
  • Benchmark systems to test performance
  • Robot control systems
  • Infra stack (GPU orchestration, compute management)

Our team includes both research and software engineers, working fluidly across AI model development and software infrastructure. We collaborate closely with Academy Researchers, robotic hardware partners, and internal business developers to deliver cutting-edge robotics solutions.


Position Overview

We are seeking talented individuals to develop and apply innovative AI-based robot control models. This role involves designing AI-driven systems that model complex robotic components—including motion, physical form, and sensor interactions—to optimize real-world performance. You will play a key role in designing and optimizing high-performance model architectures required by next-generation robotic systems, enabling intelligent and efficient learning and behavior in physical robots.

Join us at the forefront of robotics innovation—where your creativity and expertise will drive the future. We look forward to growing together with you!


Key Responsibilities

  • Research and Development of VLA and Action Generation Models
    • Design model architectures that integrate visual (image/video), language, and robotic action data
    • Apply and optimize deep learning techniques for effective multimodal information processing
  • Imitation Learning–based Model Development
    • Develop algorithms that learn robotic control policies from demonstration data
    • Design data collection, preprocessing pipelines, and model evaluation processes
  • Reinforcement Learning (RL)–based Policy Training
    • Improve robotic control performance using RL algorithms (policy-based, value-based methods, etc.)
    • Research algorithms that enhance learning efficiency and stability in both simulation and real-world environments
  • Large-scale Model Training and Optimization
    • Conduct large-scale model training and hyperparameter optimization using high-performance computing (HPC) or GPU clusters
    • Maximize training speed and accuracy through parallel and distributed learning frameworks
  • Model Validation and Cross-functional Collaboration
    • Test and analyze model performance comprehensively in both simulated and real robotic environments
    • Collaborate with robotic system engineers, software engineers, and related teams to achieve integrated implementation and continuous improvement


Required Qualifications

  • Strong Knowledge in Machine Learning / Deep Learning
    • Understanding and practical experience with neural networks, CNN/RNN, Transformers, etc.
  • Experience in VLA or VLM Model Development
    • Ability to design and implement models that combine multimodal data (vision, language, motion).
  • Understanding of Imitation Learning & Reinforcement Learning
    • Experience applying algorithms such as DAgger, Behavior Cloning, Q-learning, and Policy Gradients.
    • Practical knowledge of training policies in both simulation and real-world settings.
  • Programming Skills
    • Proficiency in Python and/or C++ for developing and optimizing robotics AI models.
    • Experience with version control tools like Git.
  • Distributed / Parallel Training Experience
    • Hands-on experience training large models in GPU clusters or HPC environments and optimizing their performance.


Preferred Qualifications

  • Experience in Robotics or Autonomous Driving Projects
    • Experience integrating models into real or simulated environments using ROS and tools like MuJoCo, Gazebo.
  • Experience with Data Pipelines and MLOps
    • Experience in automating machine learning workflows, including data handling, model serving, and CI/CD.
  • Mathematical & Statistical Analysis Skills
    • Solid understanding of probability theory, optimization, and mathematical foundations of reinforcement learning.
  • Research & Publication Experience
    • Publications or presentations on robotics AI at top-tier conferences/journals such as ICRA, IROS, or NeurIPS.


Working Conditions

  • Work Location: 561 Seolleung-ro, Gangnam-gu, Seoul (RUBINA Building, Yeoksam-dong)
  • Employment Type: Full-time
  • Probationary Period A three-month probationary period will apply upon employment. During this period, your work attitude and performance will be evaluated. Depending on the evaluation results, the probationary period may be extended or the employment offer may be withdrawn.


How to Apply

  • Email Subject: RLWRLD [Position Title] Application_[Your Name]
  • Application Materials:
    • Resume in English or Korean
    • (optional) Portfolio, research materials, or project documents showcasing your capabilities
  • Application Deadline: Rolling basis


Recruitment Process

  • Resume Screening → First Round Interview → Second Round Interview → Final Interview → Offer
  • Candidates who pass the document screening will be contacted individually.
  • Additional Coffee Chats or Coding Test may be conducted if necessary.
지원하러 가기

기업 사정으로 조기 마감되거나 내용이 변경될 수 있습니다

기업 사정으로 조기 마감되거나 내용이 변경될 수 있습니다

Unpublish ON
previous arrow
next arrow