확인 기준일: 2026년 5월 17일입니다. 이 글은 MolmoAct 2 오픈 로보틱스 파운데이션 모델를 중심으로 공식 발표와 공식 문서를 대조해 정리했습니다. MolmoAct 2는 로봇 모델 경쟁이 빅테크 내부 데모에만 머물지 않고, 오픈 연구 생태계로 내려오고 있음을 보여줍니다.

NEXT READING
이 글과 이어서 볼 흐름
관련 허브와 다음 글을 함께 보면 선택 기준과 기술 맥락을 더 빠르게 잡을 수 있습니다.
MolmoAct 2 오픈 로보틱스 파운데이션 모델 핵심 요약
- Ai2는 MolmoAct 2를 실제 세계에서 작동하는 로봇을 위한 오픈 기반으로 소개합니다.
- 오픈 모델은 작은 연구팀과 스타트업이 같은 출발선에서 비교 실험을 할 수 있게 만듭니다.
- 상용 제품으로 가려면 모델 공개보다 데이터 품질, 안전 검증, 하드웨어 적응이 더 중요합니다.
공식 자료 기반 세부 해설
MolmoAct 2는 오픈 로보틱스 모델이 단순 공개 모델을 넘어 실제 로봇 조작 평가와 데이터셋 공개로 이동하고 있음을 보여줍니다.
- Ai2는 MolmoAct 2가 Molmo 2-ER와 action expert를 결합하고, flow matching으로 로봇 행동을 생성한다고 설명합니다.
- VLM과 action expert는 KV-cache bridge로 연결되며, MolmoAct 2-FAST Tokenizer를 함께 공개했습니다.
- base action call은 약 180ms, adaptive-depth reasoning 사용 시 약 790ms로, 이전 MolmoAct의 6700ms보다 크게 빨라졌다고 공개됩니다.
- 700시간 규모 MolmoAct 2-Bimanual YAM 데이터셋과 다양한 공개 로봇 데이터 혼합이 사용됐고, 고유 instruction label은 약 71K에서 146K로 확장됐습니다.
| 구분 | 공식 자료에서 확인할 내용 | 읽어야 할 의미 |
|---|---|---|
| 아키텍처 | Molmo 2-ER + action expert + KV-cache bridge | VLM과 행동 생성기를 분리해 추론과 제어를 함께 다룹니다. |
| 속도 | 180ms/base, 790ms/adaptive-depth | 로봇이 움직임 사이에 멈춰 보이지 않으려면 지연시간이 핵심입니다. |
| 데이터 | 700시간 bimanual YAM + 공개 데이터 혼합 | 오픈 모델의 경쟁력은 모델 공개보다 데이터 품질과 다양성에서 나옵니다. |
모델·제품 스펙을 해석하는 방법
MolmoAct 2의 전문적인 관전 포인트는 “오픈 모델이냐”가 아니라 “오픈 평가가 가능한가”입니다. 실제 로봇 제어에서는 모델 지연시간, bimanual 데이터, instruction re-annotation, adaptive depth routing 같은 세부 요소가 사용성을 결정합니다. 이 글에서는 오픈 생태계가 폐쇄형 데모와 다른 방식으로 신뢰를 쌓는다는 점을 강조했습니다.
참고한 공식 자료와 논문 맥락
- Ai2 – MolmoAct 2 공식 글 – 아키텍처, latency, 데이터셋, 평가 수치를 확인했습니다.
왜 지금 중요한가
로봇 연구는 장비와 데이터 장벽이 높습니다. 오픈 모델과 도구가 많아질수록 무엇이 실제로 일반화되는가를 더 넓은 커뮤니티가 검증할 수 있습니다.
기술적으로 봐야 할 지점
MolmoAct 2의 의미는 특정 작업 하나를 잘하는 데서 끝나지 않습니다. 여러 조작 작업에서 공통 표현을 만들고, 새로운 로봇 몸체에 맞춰 조정할 수 있는지 보는 것이 핵심입니다.
| 볼 지점 | 해석 기준 |
|---|---|
| 모델 | 단일 데모보다 여러 환경에서 같은 판단을 유지하는지 봅니다. |
| 데이터 | 실제 데이터, 시뮬레이션 데이터, 원격조작 데이터가 어떻게 섞였는지 확인합니다. |
| 제품성 | 성능 수치와 함께 배포, 유지보수, 안전 정지, 실패 복구 기준을 봅니다. |
실무 해석
오픈 로보틱스 모델은 폐쇄형 모델을 바로 이기는 전략이 아닙니다. 대신 실패를 공개적으로 축적하는 전략입니다. 이 축적이 쌓이면 로봇 분야에서도 소프트웨어처럼 기준 벤치마크가 빨리 정리될 수 있습니다.
도입 전 체크포인트
- 코드·모델·데이터 중 무엇이 실제로 공개됐는지 구분합니다.
- 실제 로봇 평가와 시뮬레이션 평가를 따로 봅니다.
- 새로운 작업에 적응하는 비용을 확인합니다.