Categories: AI 뉴스 & 트렌드

LeRobot v0.5.0: 모든 차원 확장

## LeRobot v0.5.0: 모든 차원 확장

LeRobot 프로젝트는 꾸준한 발전을 거듭하며, 이번 v0.5.0 버전은 이전 버전에 비해 더욱 괄목할 만한 변화를 선보입니다. 200개 이상의 PR 병합과 50명 이상의 새로운 기여자가 참여하며 만들어진 LeRobot v0.5.0은 하드웨어, 정책, 데이터셋, 시뮬레이션 환경, 코딩 베이스 등 모든 영역에서 폭발적인 성장과 발전을 이루었습니다. 이번 릴리스는 특히 **LeRobot** 생태계를 확장하고, 실제 하드웨어와 시뮬레이션 환경 모두에서 정책을 훈련하고 배포하는 데 필요한 기반을 제공합니다.

### 주요 변경 사항 요약 (TL;DR)

LeRobot v0.5.0은 전체 Unitree G1 휴머노이드 지원(전신 제어 모델), 실시간 추론을 위한 Pi0-FAST 자기 회귀 VLA 및 실시간 청킹(RTC)을 포함한 새로운 정책, 스트리밍 동영상 인코딩을 통해 기록 에피소드 사이의 대기 시간을 제거하는 것을 추가했습니다. 또한 Hugging Face Hub에서 시뮬레이션 환경을 로드할 수 있는 EnvHub, NVIDIA IsaacLab-Arena 통합, Python 3.12+, Transformers v5, 타사 정책 플러그인을 사용한 주요 코딩 베이스 현대화가 포함되었습니다.

### 하드웨어 지원 확대: 더욱 많은 로봇

LeRobot v0.5.0은 기존의 팔 로봇 및 이동 로봇 외에도 전신 휴머노이드 로봇까지 지원 범위를 대폭 확장했습니다. 이는 **LeRobot** 프로젝트의 중요한 진전으로, 테이블탑 팔 로봇에서 전체 신체 임베디드 AI로 나아가게 합니다.

#### Unitree G1 휴머노이드 지원

이번 릴리스의 가장 큰 하드웨어 추가는 바로 Unitree G1 휴머노이드 지원입니다. LeRobot의 첫 휴머노이드 통합으로, 다음과 같은 기능을 제공합니다.

* **보행 및 이동:** 환경을 걸어 다니고 이동합니다.
* **조작:** 능숙하게 물체를 조작하는 작업을 수행합니다.
* **원격 제어:** 직관적인 원격 제어 인터페이스를 사용하여 G1을 원격으로 제어합니다.
* **전신 제어(WBC):** 복잡하고 실제적인 작업을 위해 보행과 조작을 동시에 조정합니다.

#### OpenArm 및 OpenArm Mini 지원

OpenArm 로봇과 OpenArm Mini 텔레오퍼레이터 지원도 추가되었습니다. OpenArm은 LeRobot과 완벽하게 통합된 강력한 팔 로봇이며, Mini는 자연스러운 텔레오퍼레이션 장치 역할을 합니다. 둘 다 이중-팔 설정을 지원하여 더 복잡한 조작 작업을 수행할 수 있습니다.

#### 추가 로봇 지원

Earth Rover: LeRobot을 야외 탐색 및 지상 로봇 공학으로 가져오는 첫 번째 이동 로봇 통합입니다.

OMX 로봇: 구성 가능한 그리퍼 설정 및 교정 지원 기능을 갖춘 새로운 팔 로봇입니다.

SO-100/SO-101 통합: SO-100 및 SO-101 구현을 단일하고 깔끔한 코드로 통합했습니다. 코드 중복을 줄이고 유지 관리를 용이하게 했습니다.

#### CAN 버스 모터 지원

CAN(Controller Area Network) 버스 지원을 통한 새로운 모터 컨트롤러 지원은 더 높은 성능의 액추에이터로 이어집니다.

RobStride: 고토크 애플리케이션을 위한 CAN 기반 모터 컨트롤러입니다.

Damiao: 또 다른 CAN 버스 모터 컨트롤러는 호환 가능한 하드웨어 범위를 확장합니다.

### 정책: 성장하는 모델 동물원

이번 릴리스에서는 LeRobot에 6개의 새로운 정책과 기술이 추가되어 오픈 소스 로봇 학습의 경계를 넓히고 있습니다. **LeRobot**은 다양한 정책과 기술을 지원함으로써 활용성을 높이고 있습니다.

#### Pi0-FAST: 자기 회귀 VLA

Pi0-FAST는 FAST(Frequency-space Action Sequence Tokenization)를 사용하여 LeRobot에 자기 회귀 Vision-Language-Action 모델을 도입합니다. Pi0의 flow-matching 접근 방식과 달리 Pi0-FAST는 Gemma 300M을 기반으로 한 자기 회귀 액션 전문가를 사용하여 이산화된 액션 토큰을 생성합니다.

#### 실시간 청킹 (RTC)

실시간 청킹은 Physical Intelligence에서 가져온 추론 시간 기술로, flow-matching 정책의 반응성을 크게 향상시킵니다. 전체 액션 청크가 완료되기 전에 다시 계획하는 대신 RTC는 새로운 예측을 진행 중인 작업과 지속적으로 혼합하여 더 부드럽고 반응적인 동작을 생성합니다.

### 데이터셋: 더 빠른 기록, 더 빠른 훈련

이번 릴리스에서는 데이터 파이프라인에 큰 성능 개선이 이루어져 데이터 수집 및 훈련이 크게 빨라졌습니다. **LeRobot**은 데이터셋 파이프라인의 효율성을 향상시켜 개발 시간을 단축합니다.

#### 스트리밍 동영상 인코딩

이전에는 에피소드가 끝난 후 비디오 인코딩이 완료될 때까지 기다려야 했습니다. 하지만 이제는 스트리밍 동영상 인코딩을 통해 에피소드가 캡처되는 동안 실시간으로 프레임을 인코딩하므로 에피소드 사이의 대기 시간이 사라졌습니다.

#### 10배 빠른 이미지 훈련, 3배 빠른 인코딩

데이터 액세스 병목 현상을 해결하고 이미지 처리를 전반적으로 개선하여 이미지 훈련 속도를 10배, 인코딩 속도를 3배 향상시켰습니다.

#### 새로운 데이터셋 도구

데이터셋 편집 툴킷은 지속적으로 성장하고 있습니다. 서브태스크 지원, 이미지-비디오 변환, 새로운 편집 작업 및 기존 작업 수정 등 다양한 기능을 제공합니다.

### EnvHub: Hub에서 환경 가져오기

EnvHub는 LeRobot에서 시뮬레이션 환경을 사용하는 새로운 방법입니다. Hugging Face Hub에서 환경을 직접 로드할 수 있습니다. 이 기능을 통해 **LeRobot** 사용자는 Hub 리포지토리를 가리키기만 하면 코드를 다운로드하고 Gymnasium에 등록하고 훈련 및 평가에 사용할 수 있도록 처리합니다.

### 결론

이번 LeRobot v0.5.0 릴리스는 단순히 새로운 기능 추가를 넘어, 로봇 학습 생태계 전체의 혁신을 의미합니다. 더 많은 로봇 지원, 빠른 훈련, 편리한 환경 관리, 그리고 현대적인 코딩 베이스는 LeRobot을 더욱 강력하고 사용자 친화적인 플랫폼으로 발전시켰습니다. LeRobot 팀은 앞으로도 커뮤니티의 적극적인 참여와 피드백을 바탕으로 지속적인 발전을 이어나갈 것입니다.

심층 분석 및 시사점

Array

원문 출처: LeRobot v0.5.0: Scaling Every Dimension

PENTACROSS

Recent Posts

울리세스 시퀀스 병렬 처리: 100만 토큰 컨텍스트로의 학습

울리세스 시퀀스 병렬 처리: 100만 토큰 컨텍스트로의 학습 울리세스 시퀀스 병렬 처리: 100만 토큰 컨텍스트로의…

2시간 ago

공공 기관, 오픈 소스 소프트웨어 지원에 실패하고 있나?

소개: 오픈 소스, 기술 혁신의 숨은 동력, 하지만 지속 가능한 지원은 과연? 우리 일상생활을 편리하게…

4시간 ago

앤드류 응의 Context Hub: 코딩 에이전트를 위한 최신 API 문서 제공 오픈소스 툴

앤드류 응의 Context Hub: 코딩 에이전트를 위한 최신 API 문서 제공 오픈소스 툴 코딩 에이전트,…

4시간 ago

Granite 4.0 1B 음성 모델: 엣지 환경에 최적화된 소형, 다국어 모델

Granite 4.0 1B 음성 모델: 엣지 환경에 최적화된 소형, 다국어 모델 Granite 4.0 1B 음성…

5시간 ago

GPT-2 모델 훈련, 단 2시간? Nanochat의 놀라운 변화

GPT-2 모델 훈련, 단 2시간? Nanochat의 놀라운 변화 AI 개발의 가속화: 과거와 현재의 격차를 뛰어넘다…

5시간 ago

Anthropic Claude Code: 코드 리뷰 자동화로 복잡한 보안 연구를 혁신하다

Anthropic Claude Code: 코드 리뷰 자동화로 복잡한 보안 연구를 혁신하다 Anthropic Claude Code: 코드 리뷰…

5시간 ago