로봇을 똑똑하게 만드는 것은 더 좋은 팔도, 더 강한 모터도 아니다. 데이터다.
아마존 로보틱스(Amazon Robotics)는 '로빈(Robin)'이라는 로봇 함대를 운영한다. 컨베이어 벨트 위 뒤섞인 무더기에서 택배를 하나씩 집어 분류하는 작업을 매일 수백만 건씩 처리하는 시스템이다. 초기에는 사람이 정한 규칙을 따르는 방식으로 작동했다. 어떤 물체를 어떻게 집어야 성공할 가능성이 높은지 미리 정해두고 그대로 따르는 방식이었다. 그러나 포장재가 미끄럽거나, 물체가 비스듬히 쌓여 있거나, 모양이 일정하지 않으면 실패가 잦았다. 규칙이 현실을 따라가지 못했다.
아마존 로보틱스의 연구팀이 2025년 6월 발표한 논문 「대규모 실세계 로봇 자동 분류를 위한 택배 집기 최적화 학습(Learning to Optimize Package Picking for Large-Scale, Real-World Robot Induction)」은 이 문제를 다른 방식으로 풀었다.
핵심은 두 단계로 이루어진 학습 구조다. 먼저 과거의 실제 픽업 기록을 바탕으로 어떤 집기 동작이 성공할 가능성이 높은지를 예측하는 모델을 만든다. 그 다음, 실제 현장에서 수행한 집기 동작에 의도적으로 미세한 변형을 가해 더 나은 집기 방식을 찾아가는 최적화 모델을 추가로 학습시킨다. 규칙을 사람이 정하는 대신, 현장의 시도와 실패 기록이 스스로 더 나은 방법을 찾아가도록 한 것이다. 이 방식을 200만 건이 넘는 집기 시도에 적용해 검증한 결과, 기존 방식 대비 집기 실패율이 상대적으로 약 19% 줄었다. 로봇 팔이 달라진 것이 아니다. 같은 팔이 더 많은 경험을 쌓았을 뿐이다.
창고가 이 변화를 가장 먼저 이끈 데는 이유가 있다. 공장의 로봇은 정해진 부품을 정해진 방식으로 다루지만, 창고의 로봇은 매일 다른 모양, 다른 무게, 다른 포장의 물건을 마주한다. 그 끊임없는 다양함이 로봇에게 가장 값진 학습 재료가 됐다. 창고는 애초에 그럴 의도가 없었음에도, 피지컬 AI가 무엇으로 자라는지를 가장 먼저 보여준 현장이 됐다.
그렇다면 데이터는 무조건 많이 쌓을수록 좋은 것일까.
2025년 10월, 중국의 칭화대학교(Tsinghua University) 등이 참여한 연구팀은 논문 「로봇 조작에서의 모방학습 데이터 규모 법칙(Data Scaling Laws in Imitation Learning for Robotic Manipulation)」에서 예상을 뒤엎는 답을 내놓는다. 연구팀은 물 따르기와 마우스 정리라는 두 가지 작업을 놓고, 로봇이 한 번도 마주하지 못한 새로운 환경과 물체에서 성공하려면 어떤 데이터가 필요한지를 4만건이 넘는 시연과 1만5000건이 넘는 실제 로봇 실행을 통해 검증했다.
결론은 명확했다. 로봇이 낯선 환경과 물체에 적응하는 힘은 같은 조건에서 반복 횟수를 늘린다고 비례해서 커지지 않았다. 어느 지점을 넘어서면 추가 반복은 거의 효과가 없었다. 반면 훈련 환경과 물체의 종류를 다양하게 넓힐수록 적응력은 뚜렷하게 향상됐으며, 이 관계는 통계적으로 일정한 패턴을 따랐다. 연구팀이 이 원리를 바탕으로 제안한 전략은 간결했다. 최대한 다양한 환경에서 각각 하나의 물체와 50회 정도의 시연을 수집하라는 것이다. 실제로 네 명이 하루 오후 동안 서른두 곳의 환경을 돌며 데이터를 모았을 뿐인데, 그렇게 훈련한 로봇은 한 번도 본 적 없는 환경과 물체에서도 90%에 가까운 성공률을 기록했다. 반복의 양보다 경험의 다양성이 결정적이라는 것, 이것이 이 연구가 확인한 핵심이다.
두 연구는 결국 같은 말을 하고 있다. 로봇을 더 유능하게 만드는 것은 더 정교한 알고리즘이 아니라, 얼마나 다양한 현실을 경험했느냐다. 창고가 이 사실을 가장 먼저 알아챈 것은 우연이 아니다. 매일 낯선 물건이 쏟아지는 공간이었기 때문이다.
피지컬 AI를 도입하려는 병원, 학교, 복지시설이 제조사의 성능 수치 앞에서 먼저 물어야 할 것이 있다. 그 성능은 어떤 데이터로 만들어진 것인가. 로봇 제조사가 내세우는 수치는 대개 그 회사가 가장 많이, 가장 다양하게 쌓아온 데이터의 결과물이다. 그런데 병원 복도, 학교 교실, 요양원 식당은 그 데이터가 만들어진 환경과 다르다. 새로운 현장에 로봇을 들인다는 것은 그 현장에 맞는 데이터를 처음부터 다시 쌓아야 한다는 뜻이기도 하다. 아무리 정교한 팔과 센서를 갖추고 있어도, 데이터가 없는 로봇은 결국 빈손이다.
피지컬 AI의 다음 경쟁은 누가 더 뛰어난 로봇을 만드느냐가 아니라, 누가 더 다양한 현실을 데이터로 품었느냐에서 판가름 날 것이다. 이제 그 무대는 창고를 넘어 병원으로, 학교로, 거리로 넓어지고 있다. 그 공간들이 로봇에게 충분히 다양한 현실을 가르쳐 줄 준비가 되어 있는지, 기술보다 먼저 우리 사회가 물어야 한다. 로봇의 실력은 결국, 우리가 무엇을 보여줬느냐의 총합이다.
최홍규 연구위원(EBS) / 미디어학 박사
ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지