[뉴스토마토 신상민 기자]
카카오(035720)모빌리티가 과학기술정보통신부(과기정통부)와 자율주행기술개발혁신사업단(KADIF)의 '자율주행 기술개발 혁신사업' 국책과제 일환으로 구축한 ‘인공지능(AI) 학습용 자율주행 데이터셋’을 한국전자통신연구원(ETRI) ‘AI 나눔’에 공개했다고 28일 밝혔습니다.
카카오모빌리티는 레벨 4(Lv.4) 자율주행 구현을 목표로 해당 사업에 참여해 차량, 엣지-인프라, 지능학습을 연계한 융합형 자율주행 데이터의 생성·관리·배포 자동화 기술을 개발했습니다. 또한, 국내 도로 환경에서 구축한 비식별화된 AI 학습용 데이터셋을 일반에 공개해, 누구나 저작권 문제 없이 자유롭게 자율주행 연구개발에 활용할 수 있도록 했습니다.
그동안 소규모 기업이나 학계, 연구기관은 자율주행 데이터를 확보하는 데 막대한 비용과 시간이 소요돼 라이다·레이더·카메라 센서를 직접 운용하기 어려웠습니다. 또한, 기존에 공개된 데이터셋은 대부분 해외 지역에서 특정 시간대에 수집된 데이터여서, 국내 실정에 맞는 연구개발에 한계가 있었습니다.
카카오모빌리티가 이번에 공개한 데이터셋은 국내 주요 도로변에 설치된 라이다·카메라 센서 등 엣지-인프라와 카카오모빌리티가 직접 운영한 자율주행차를 통해 획득했습니다. 데이터셋은 사람, 차량, 자전거 등 3D 동적 객체와 신호등, 표지판 등 2D 정적 객체를 인지·판단할 수 있도록 구성됐으며, 총 10개 유형, 15만 건의 데이터로 이뤄져 있습니다. 이를 활용하면 국내 도로 환경에 적합한 자율주행 AI 모델 개발 및 학습이 가능할 것으로 기대됩니다.
특히 해당 데이터는 도로타입(고속도로, 국도, 지하차도, 터널 등), 시간(주·야간), 날씨(맑음·강우·안개 등) 등 총 31개 카테고리의 다양한 환경 조건에서 수집됐습니다. 라이다 센서를 통해 취득한 포인트클라우드의 좌표값은 물론 사람, 사물 등 개체 속성을 구분할 수 있는 세분화(Pointcloud segmentation) 데이터도 포함돼 활용 가치가 높습니다.
ETRI가 자율주행 차량에 해당 데이터셋을 학습해 실증한 결과, 사람과 차량, 자전거 등 3D 동적 객체 검출 AI 성능은 약 5~8%, 신호등 인식 AI 성능은 약 2%가 향상된 것으로 나타났습니다. 특히 도심지 야간 교통 정체 상황, 보행자 신호등과 같은 희소 데이터에 대한 AI 성능이 크게 향상됐습니다. 자율주행 AI의 객체 검출 및 인식 성능이 향상되면, 주변 환경을 보다 정확히 인식해 안정적인 자율주행이 가능합니다.
카카오모빌리티는 과기정통부·ETRI·정보통신기획평가원(IITP)·KADIF·자율주행DNA기술포럼과 함께 지난해 8월 해당 학습 데이터셋 일부를 활용해 과기정통부 주최 ‘제1회 자율주행 인공지능 챌린지’를 개최해 참석자들에게 자율주행 AI 데이터 활용 역량 향상의 기회를 제공했습니다.
장성욱 카카오모빌리티 미래이동연구소장은 "이번 데이터셋 공개가 국내 자율주행 기술의 상용화와 발전을 앞당기는 초석이 되길 기대한다”며 “앞으로도 다양한 공공 및 민간기업과 협력해 자율주행 기술 혁신과 공공 데이터 활용 확대에 앞장서겠다"고 밝혔습니다.
정광복 KADIF 단장은 “본 사업을 통해 ‘미래의 석유’라 불리는 15만 건의 융합형 자율주행 학습 데이터셋을 공개하게 돼 기쁘게 생각한다”며 “이번에 공개된 학습 데이터가 관련 학계, 스타트업 등의 성장 발판이 되고, 나아가 AI 자율주행 기술 고도화에 기여할 수 있기를 기대한다”고 말했습니다.
한편, 정부는 2027년 융합형 Lv.4+ 자율주행 상용화 기반 완성을 목표로 '자율주행 기술개발 혁신사업'을 추진 중이며, 카카오모빌리티는 과기정통부와 IITP, KADIF의 지원을 받아 해당 사업과제를 수행했습니다.
자율주행 차량용 다중센서 융합형 3D 동적객체 검출 추적 학습 데이터.(이미지=카카오모빌리티)
신상민 기자 lmez0810@etomato.com
이 기사는 뉴스토마토 보도준칙 및 윤리강령에 따라 김나볏 테크지식산업부장이 최종 확인·수정했습니다.
ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지