2025년 4월 14일, 구글은 조지아공대(Georgia Tech)와 ‘와일드 돌핀 프로젝트(Wild Dolphin Project, WDP)’와 협력하여 돌고래와 소통을 시도하는 인공지능 모델 ‘돌핀제마(DolphinGemma)’를 공식 발표했습니다.
이 프로젝트는 기존의 동물 소리 인식 연구를 넘어, 돌고래가 실제로 사용하는 소리의 패턴, 맥락, 사회적 의미까지 해석하려는 야심찬 시도로 주목받고 있습니다.
돌핀제마는 무엇을 목표로 하나?
- 단순한 소리 분류를 넘어, 돌고래의 감정, 의도, 사회적 상호작용을 해석
- 특정 소리 패턴이 발생하는 환경적 조건과 행동 상황까지 분석
- 장기적으로는 양방향 소통(인간 ↔ 돌고래) 가능성 탐색
특히 이번 연구는, 돌고래가 단순히 소리를 내는 것을 넘어서 ‘의미 있는 대화’를 한다는 가설을 과학적으로 검증하려는 시도입니다.
수집된 데이터와 분석 방식
- 40년간 축적된 대서양 점박이 돌고래 데이터 활용 (휘파람, 클릭음, 스쿼크 등 다양한 음성 데이터)
- 약 100만 시간 이상의 음성 데이터 (음성뿐 아니라, 행동, 주변 환경, 다른 동물들과의 상호작용 정보 포함)
- 현장 데이터 실시간 수집 → 스페인 바하칼리포르니아 지역 해안에서 직접 채집된 신선한 데이터 활용
구글은 자체 오디오 인식 기술인 SoundStream을 기반으로, 돌고래 소리를 ‘토큰화(tokenization)’하여 패턴을 학습시켰습니다. 이는 마치 사람의 언어를 단어 단위로 분석하는 것과 유사한 방식입니다.
기술적 특징
기능 | 설명 |
---|---|
SoundStream 기반 오디오 토크나이저 | 돌고래 소리를 압축하고 중요한 특징만 뽑아내어 분석 가능 |
경량화 모델 (약 4억 파라미터) | 구글 픽셀 스마트폰에서도 실시간 실행 가능 |
컨텍스트 기반 학습 | 단순 소리 인식이 아닌, 소리 + 상황 + 행동을 함께 분석 |
CHAT 시스템 연동 | 돌고래와 인간 간 양방향 소통 실험 진행 가능 |
돌고래 소통의 구체적 시도
돌핀제마 프로젝트는 기존의 동물 소리 연구와 크게 다릅니다.
단순히 “이 소리는 경고음이다”, “이 소리는 놀이 신호다”를 넘어서:
- 같은 휘파람이라도 상황에 따라 의미가 다를 수 있다는 점을 분석
- 돌고래가 ‘자신을 소개하는 휘파람(Signature Whistle)’을 사용할 때 주변 행동까지 함께 파악
- 감정 상태(긴장, 호기심, 스트레스 등)를 소리 패턴으로 구별하려는 시도
즉, 돌고래의 소리 + 행동 + 주변 상황을 종합적으로 읽어내어,
의도적인 ‘대화’의 형태를 포착하려는 것입니다.
향후 계획과 전망
구글은 돌핀제마를 기반으로, 향후 다른 동물 종(예: 고래, 코끼리, 앵무새 등)으로 연구 대상을 확대할 계획입니다. 또한, 단순한 분석에 그치지 않고, AI를 통한 실시간 ‘대화 시뮬레이션’까지 가능하게 만드는 것을 장기 목표로 삼고 있습니다.
이번 프로젝트는 단순한 기술적 실험을 넘어, ‘생명체 간 소통의 한계’를 넘는 첫 시도라는 점에서 과학계, 생태계, AI 업계 모두에게 큰 주목을 받고 있습니다.
TI Tech Lab 김준수 연구원
Source
- https://blog.google/technology/ai/dolphingemma/
- https://www.unite.ai/how-googles-ai-is-unlocking-the-secrets-of-dolphin-communication/
- https://www.smithsonianmag.com/smart-news/google-is-training-a-new-ai-model-to-decode-dolphin-chatter-and-potentially-talk-back-180986434/
- https://www.foxnews.com/science/google-working-decode-dolphin-communication-using-ai
Add comment