공장에서 가장 오래된 질문은 "어떻게 더 빠르게 반복할 것인가"였다. 그 질문이 지금 바뀌고 있다. "예상하지 못한 상황에서 어떻게 스스로 판단할 것인가"로.
로봇이 멈추면 공장도 멈췄다. 관리자가 달려와 상황을 파악하고 지시를 내려야 라인이 다시 돌아갔다. 공장의 로봇은 오랫동안 철저히 '지시를 받는 존재'였다. 어떤 부품을 어느 순서로 집어 어디에 놓는지, 모든 동작은 엔지니어가 미리 써넣은 규칙 안에서만 작동했다. 규칙 밖의 상황이 오면 로봇은 멈추거나 경보를 울렸다. 판단은 언제나 사람의 몫이었다. 그런데 이제 그 몫의 일부를 언어모델(LLM: Large Language Model)이 대신하기 시작했다.
2025년 5월, 펜실베이니아주립대학교(Pennsylvania State University) 연구진이 실제 제조 환경에서 이 변화를 시험했다. 두 대의 로봇 팔이 부품을 분류하는 현장에서 한 대가 고장 났을 때, 시스템이 스스로 어떻게 대응하는지를 살펴본 실험이다. 고장이 감지되면 시스템 전체를 관리하는 중앙 제어 장치가 곧바로 언어모델에게 현재 상황을 전달한다. 언어모델은 남은 로봇들의 능력과 작업 조건을 살펴 누가 어떤 작업을 이어받을 수 있는지 판단한다. 사람이 개입하기 전에 라인이 스스로 재편되는 구조다.
20회 실험에서 시스템은 매번 유효한 재배치 방안을 찾아냈다. 첫 시도에서 곧바로 성공한 비율은 60%였고, 나머지는 한차례 이상 다시 시도해야 했다. 평균 소요 시간은 약 19초였다. 물론 언어모델이 틀린 경우도 있었다. 로봇의 손이 닿지 않는 위치에 작업을 배정하거나, 실제로는 없는 센서가 있다고 가정하고 판단을 내리기도 했다. 그럴 때마다 시스템은 무엇이 잘못됐는지를 언어모델에게 다시 알려주고, 언어모델은 그 정보를 받아 수정된 방안을 내놓았다. 연구진은 이런 실패 사례를 그대로 공개하며 불확실한 조건에서 언어모델의 추론이 더 안정적으로 작동하도록 만드는 것이 앞으로의 핵심 과제라고 밝혔다. 시스템은 작동했지만, 완전히 믿고 맡길 수 있는 단계에는 아직 이르지 못한 셈이다.
기존 제조 시스템과 비교하면 차이는 분명하다. 기존 시스템은 일어날 수 있는 예외 상황마다 대응 규칙을 사람이 일일이 써넣어야 했다. 그러나 현실의 공장에는 누구도 미리 예상하지 못한 변수가 반드시 생기기 마련이다. 언어모델 기반 시스템은 그 모든 경우의 수를 미리 입력해두지 않고도, 그때그때 주어진 상황 정보를 읽어 판단을 내린다. 정해진 동작을 잘 반복하는 능력과, 낯선 상황을 읽어 판단하는 능력은 전혀 다른 차원의 능력이다. 공장 자동화가 처음으로 후자를 로봇에게 요구하기 시작한 것이다.
같은 해인 2025년 12월에 나온 또 다른 연구는 이 변화가 단순한 기술적 진전을 넘어선다는 사실을 보여준다. 노스이스턴대학교(Northeastern University) 연구진 등이 발표한 논문 「민첩한 제조 자동화를 위한 인간 중심 범용 피지컬 인텔리전스(Human Centric General Physical Intelligence for Agile Manufacturing Automation)」는 제조 현장에서 로봇이 갖춰야 할 상황 판단 능력을 여섯 가지로 나누어 정리했다. 1) 주변 정보를 다양한 감각으로 통합해 받아들이는 능력, 2) 가상 훈련과 실제 현장의 차이를 줄이는 능력, 3) 긴 호흡으로 작업 순서를 계획하는 능력, 4) 계획을 실제 동작으로 옮기는 능력, 5) 불확실한 상황에서도 안전을 지키는 능력, 그리고 6) 그 모든 성능을 측정하고 점검하는 능력이다.
이 논문이 거듭 강조하는 개념은 '회복 탄력성(resilience)'이다. 상황을 읽는 로봇이란 결국 예상치 못한 일이 생겨도 무너지지 않고 제 기능을 이어가는 로봇이라는 뜻이다. 논문은 이런 능력을 '범용 피지컬 인텔리전스(GPI: General Physical Intelligence)'라 부르며, 아직 산업 현장에 배치할 만큼 충분히 성숙하지는 않았다고 솔직하게 평가한다. 다만 부품과 설비가 자주 바뀌는 제조 환경에서, 다시 훈련시키지 않고도 몇 차례의 시범 동작만으로 새로운 작업을 익히는 방식이 현실적인 대안으로 떠오르고 있다고 덧붙인다.
두 연구를 함께 읽으며 필자가 가장 주목한 지점은 기술의 완성도가 아니다. 로봇이 스스로 판단을 내리기 시작했을 때, 우리 사회가 그 변화를 받아들일 준비를 갖추고 있는가 하는 문제다.
지금까지 공장에서 일어난 사고는 책임 소재를 가리기가 비교적 쉬웠다. 로봇이 잘못 움직였다면 그 동작을 설계한 사람, 혹은 그 규칙을 승인한 관리자를 찾으면 됐다. 그런데 두 연구가 공통으로 가리키는 미래에서는 사정이 다르다. 로봇이 스스로 상황을 읽고 판단해 행동을 결정하는 순간, 그 판단이 어디서 비롯됐는지를 사람이 일일이 되짚어보기가 점점 어려워진다.
펜실베이니아주립대학교 연구진이 검증한 것은 로봇이 판단할 수 있다는 사실이지, 그 판단이 언제나 옳다는 보장이 아니다. 노스이스턴대학교 등의 연구진이 강조한 회복 탄력성 역시, 로봇이 무너지지 않고 버틴다는 것이지 항상 올바른 방향으로 버틴다는 뜻은 아니다. 두 연구를 나란히 놓고 보면, 로봇의 판단 능력은 빠르게 자라고 있지만 그 판단을 검증하고 책임지는 체계는 아직 그 속도를 따라가지 못하고 있다는 사실이 분명해진다. 기술은 '할 수 있는가'를 증명하는 단계를 지나고 있고, 우리 사회는 아직 '믿어도 되는가'를 묻는 단계에 머물러 있다.
그래서 필자는 이렇게 생각한다. 로봇이 스스로 판단하는 시대가 왔다는 사실 자체보다, 그 판단을 우리가 어디까지 믿고 맡길 것인지를 먼저 사회적으로 합의하는 일이 더 시급하다. 자율주행 자동차가 도로 위를 달리기까지 수십 년에 걸쳐 교통법규와 사고 책임 기준이 다듬어져 온 것처럼, 스스로 판단하는 로봇이 공장 안으로 들어오기 전에 우리도 그에 맞는 기준을 마련해야 한다. 그러나 지금은 그 논의의 속도가 기술이 발전하는 속도를 따라가지 못하고 있다.
지금 공장에서 벌어지는 일은 단순한 자동화의 진전이 아니다. 판단의 주체가 바뀌고 있다. 그리고 판단의 주체가 바뀌면, 반드시 책임의 주체도 다시 정해야 한다. 그 논의를 기술보다 늦게 시작하는 사회는, 언제나 기술에 끌려다닌다.
최홍규 연구위원(EBS) / 미디어학 박사
ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지