생물학적 및 인공 시스템의 시각적 국소 수용 영역(local receptive field)을 보여주는 이미지: (a-b) 생쥐 뇌 시각피질(V1)의 수용 영역, (c-d) 인공지능 AlexNet의 시각적 수용 영역. (이미지=기초과학연구원)
[뉴스토마토 서경주 객원기자] 인간 두뇌의 시각 처리 방식을 모방한 새로운 인공지능 이미지 인식 기술이 개발되었습니다. 기초과학연구원(IBS) 인지 및 사회성 연구단 이창준 단장과 연세대학교 응용통계학과 송경우 교수 연구팀은 협업을 통해, 뇌의 시각피질이 시각 정보를 선별적으로 처리하는 방식을 응용해 인공지능의 이미지 인식 성능을 향상시키는 기술을 구현했습니다.
인간의 뇌는 시각 정보를 매우 정교하고 체계적으로 처리합니다. 외부에서 들어온 빛은 수정체를 지나 망막에 도달하고, 망막의 간상세포와 원추세포는 각각 빛의 강도와 색을 감지해 이를 전기 신호로 변환합니다. 이 신호는 시신경을 통해 뇌로 전달되며, 후두엽의 1차 시각피질에서 선, 경계, 방향, 움직임 등 기본적인 시각 요소들이 처리됩니다.
이후 시각 정보는 두 가지 경로를 따라 분석됩니다. 하나는 측두엽을 통해 사물, 이미지, 문자 등 시각적 대상을 인식하며, 다른 하나는 두정엽을 거쳐 위치와 움직임을 파악합니다. 뇌는 이 과정에서 과거 경험과 기억, 주변 상황 등을 종합해 시각 정보를 해석하고, 단순한 이미지 이상의 의미를 부여합니다.
즉, 인간의 시각 인식은 단순히 외부 자극을 수용하는 것이 아니라, 감각 입력과 과거의 기억, 예측 정보를 통합해 재구성하는 복합적인 뇌 활동입니다.
기존 AI 모델의 한계…"부분은 잘 보지만 전체는 어렵다"
기존의 인공지능 이미지 분석 기술은 주로 합성곱 신경망(CNN, Convolutional Neural Network)을 기반으로 합니다. CNN은 이미지의 공간적 구조를 학습하는 데 강점을 가지지만, 국소 영역 위주로 분석하기 때문에 넓은 맥락을 이해하거나 멀리 떨어진 특징 간의 관계를 파악하는 데는 한계가 있습니다. 예를 들어, 물체의 위치가 바뀌거나 배경이 복잡한 경우에는 부분은 인식해도 전체적인 맥락을 놓치는 오류를 범할 수 있습니다.
이러한 단점을 보완하기 위한 기술로 비전 트랜스포머(ViT)가 나왔지만, 이 역시 막대한 연산량과 대규모 학습 데이터가 필요하며 학습 속도가 느려 실용성 측면에서 아직 한계가 있습니다.
이에 연구팀은 인간의 시각피질이 정보를 처리하는 방식에 주목했습니다. 인간의 뇌는 모든 시각 정보를 동일하게 처리하지 않고, 중요한 정보나 눈에 띄는 특징에 집중해 선택적, 차별적으로 반응합니다. 이러한 처리 방식은 효율적인 정보 분석을 가능하게 합니다.
Lp-컨볼루션, 인간 뇌의 선택적 시각 처리 모방한 AI 기술
연구팀은 이 같은 뇌의 시각 처리 메커니즘을 딥러닝 모델에 적용해 새로운 방식의 이미지 인식 기술인 ‘Lp-컨볼루션(Lp-Convolution)’을 개발했습니다. 이 기술은 기존 CNN이 입력 이미지와의 유사성을 학습하는 방식에서 벗어나, 차이(difference)를 중심으로 학습함으로써 더 정교하고 선택적인 정보 처리를 가능하게 합니다.
Lp-컨볼루션은 AI가 이미지를 분석할 때, 인간처럼 핵심적인 정보를 우선적으로 파악할 수 있도록 설계되었습니다. 학습 중 자동으로 형성되는 일종의 ‘필터’는 인간 뇌의 시각 피질 뉴런처럼 중요한 특징을 강조하고, 덜 중요한 요소는 자연스럽게 배제합니다. 이 필터는 학습 과정에서 스스로 형태를 조정하면서, 다양한 환경에서도 일관되게 중요한 요소에 집중할 수 있도록 돕습니다.
이번 논문의 제1저자인 권재 IBS 박사후연구원은 “사람이 복잡한 장면에서도 빠르게 핵심을 파악하듯, Lp-컨볼루션은 뇌의 정보 처리 방식을 모방해 AI가 연산 자원을 효율적으로 활용하면서도 보다 정확한 이미지 분석이 가능하도록 한다”고 밝혔습니다.
실제 뇌 반응과의 유사성 검증… CNN보다 정밀한 뉴런 예측
연구팀은 Lp-컨볼루션의 성능을 검증하기 위해, 생쥐에게 다양한 자연 이미지를 보여주고 시각 피질 뉴런의 반응을 기록했습니다. 이후 AI 모델이 해당 이미지에 대해 뉴런이 어떻게 반응할지를 예측하도록 학습시킨 결과, Lp-컨볼루션 기반 모델이 기존 CNN 모델보다 뉴런 반응을 더 정밀하게 예측하는 것으로 나타났습니다.
이창준 IBS 단장은 “이번 연구는 AI의 시각 인식 능력 향상에 그치지 않고, 뇌가 정보를 어떻게 처리하는지를 이해하고 이를 기술로 구현하는 데 실질적인 기여를 했다”며 “AI와 뇌과학의 융합이라는 새로운 연구 지평을 여는 사례가 될 것”이라고 밝혔습니다.
이번 연구 성과는 오는 4월28일부터 싱가포르에서 열리는 세계적 권위의 인공지능 관련 학술대회인 '2025 표현학습국제학회(ICLR)'에서 발표될 예정입니다.
서경주 객원기자 kjsuh57@naver.com
이 기사는 뉴스토마토 보도준칙 및 윤리강령에 따라 강영관 산업2부장이 최종 확인·수정했습니다.
ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지