구글·엔비디아·MS 등 빅테크
앞다퉈 기상예보 시장 진출
구글,40년치 데이터 활용해
1분만에 10일치 날씨 전망
엔비디아 ‘디지털 트윈’ 활용
대기환경 24시간 시뮬레이션
지난 3월 젠슨 황 엔비디아 CEO가 고해상도 날씨 시뮬레이션 플랫폼 ‘어스-2’를 공개하는 모습. 엔비디아는 이 플랫폼을 통해 지구 대기 환경을 디지털 트윈으로 구현했다. [AP = 연합뉴스] “100만곳이 넘는 지역에서 데이터를 실시간 수집해 인공지능(AI)을 활용해 1분 만에 10일 뒤 날씨를 예측한다. 하지만 종전 방식 대비 90% 이상 정확하다.”
AI가 바꾸고 있는 날씨 예보의 미래다. 2022년 생성형 AI 도입 붐이 일면서 일기예보 시장에서 큰 변화가 나타나고 있다. 구글 딥마인드,마이크로소프트,엔비디아 등이 속속 동참하고 나섰다. 날씨 예보 시장은 규모가 작지만,성장 잠재력은 크다는 평가다. 이 때문에 인류의 오랜 숙제인 ‘날씨 예보 정확도’를 AI로 높이려는 움직임이 더욱 거세질 것으로 보인다.
인류의 오랜 숙제,기상 예보
인류는 오랜 기간 날씨를 예측하려고 노력했다. 기후 변화에 대응하지 못하면 생존이 불가능해서다. 고대 바빌로니아인들은 기원전 650년께 날씨를 예측하기 위해 천문학을 동원했고,아리스토텔레스는 기상학(Meteorologica)이라는 책을 저술해 비·바람·번개에 대한 기상 현상을 설명했다.
기상학이 체계적으로 정립되기 시작한 것은 17세기다. 1643년 에반젤리스타 토리첼리가 기압계를 발명해 기압의 변화를 체계적으로 측정했고,로버트 훅과 에드먼드 핼리는 날씨를 관측하는 방법을 정립했다. 이후 19세기 들어 전신이 발명돼 날씨 전망을 전 지구적으로 전송하기 시작했고,프랑스는 1854년 나폴레옹 3세 때 유럽에 처음 ‘프랑스 기상청’을 설립했다.
미국은 1870년 국립기상서비스를 세웠다. 20세기 들어서는 이러한 체계적 시스템에 기술이 접목되기 시작했다. 1960년에 최초의 기상위성인 TIROS-1이 발사됐으며,1950~60년대 들어서는 컴퓨터의 발달로 날씨 예측 알고리즘이 속속 도입됐다. 현재는 슈퍼컴퓨터를 활용해 대기와 해양의 복잡한 상호작용을 시뮬레이션한다.
오늘날 널리 사용하는 기상예보 방식은 수치예보(Numerical Weather Prediction·NWP)다. 방식은 이렇다. 전 세계의 기상 관측소,위성,레이더,부표,항공기 등에서 수집된 다양한 기상 데이터를 모은다. 이후 수집된 데이터를 바탕으로 현재 대기의 상태를 나타내는 초기 조건을 설정한다. 조건을 입력해 대기 운동 방정식을 푼다. 이때 슈퍼컴퓨터를 동원한다.
모델 실행 결과로 미래의 대기 상태를 예측한다. 기온·강수량·바람·구름 등이 변수로 활용된다. 수치예보는 1~3일 단기 예보,3~10일 중기 예보,10일 장기 예보로 구성된다. 변수마다 다르지만 대략적인 정확도는 각각 85%,70~80%,50~60%다. 단기 예보에는 놀라운 정확도를 보여 주지만,장기 예보는 불확실성이 크다. 사람들이 불만인 이유다.
수치예보를 AI로 뛰어넘어라
특히 특정 기상 현상에 대한 예측은 어렵다. 예를 들어 폭풍,허리케인,열대 저기압 등은 매우 복잡하고 예측이 어렵다. 이러한 현상을 분석하려면 높은 해상도의 모델과 정밀한 초기 조건이 필요하다. 오늘날 많은 빅테크 기업과 연구소들이 인공지능과 머신러닝을 동원하려는 이유가 여기에 있다. 머신러닝 알고리즘이 대량의 기상 데이터를 분석해 패턴을 인식하고,초기 조건의 정확성을 높일 수 있어서다.
예를 들어 AI를 동원하면 기존의 물리 기반 모델과 결합해 하이브리드 모델을 구성할 수 있다. 또 딥러닝 모델은 기존 수치 모델의 출력을 보정하거나 세부적인 현상을 더 잘 포착할 수 있다. 이를 통해 일반적으로 종전 예보 모델보다 20% 정도 정확도를 향상할 수 있다는 평가다. 일부 연구에서는 강수량 등에 있어서는 정확도가 최대 40% 이상 높은 것으로 나타났다. 수치 예보에 머신러닝을 결합할 경우 예측 정확도는 대략적으로 15~25% 높아지는 것으로 알려졌다. 물론 변수에 따라 다르다.
사실 날씨 예측 시장은 크지 않다. 분석 업체 슈타티스타에 따르면 2023년 날씨 예보 시장은 18억2000만달러 규모다. 2027년에는 28억4000만달러로 성장할 전망이다. 다른 분석도 비슷하다. 한국기상산업기술원에 따르면 예보 시장은 30억8528만달러에서 2027년 58억3504만달러로 커질 것으로 보인다.
그러나 날씨는 산업 전반에 미치는 파급효과가 크다. 작물 생산,재해 대비,항공·해운·육상 운송,재생에너지,레저,보험,비즈니스 등 모든 산업이 날씨의 영향을 받는다. 인공지능을 활용해 비용은 낮추면서도 정확도를 높이려는 시도가 이어지는 까닭이다.
빅테크 기업들이 던진 도전장
빅테크 기업은 적극적이다. 구글 딥마인드는 그래프캐스트라는 인공지능 기반 날씨 모델을 구축했다. 레미 램 구글 딥마인드 연구과학자는 “과거 대기 상태에 대한 데이터 학습을 통해 10일간의 날씨를 예보하는 인공지능 모델을 개발했다”고 말했다. 구글 딥마인드는 위성·레이더·지상 측정 장치로 수집한 40년 치 데이터를 모델에 학습시켰다. 이후 바람,기압,온도,습도 같은 기상 변수 간 연관성을 분석했다.
그래프캐스트는 전 세계 100만곳이 넘는 곳곳에서 수집한 실제 기상 데이터를 불러들여 실시간 분석한다. 지금 현재의 데이터를 활용해 향후 6시간 뒤 날씨 변화를 예측하는 방식이다. 그리고 이를 다시 6시간 단위로 확장해 최장 10일 후 미래 날씨를 예측한다. 구글 딥마인드에 따르면 10일 예보에서 그래프캐스트는 종전 수치예보 방식보다 90% 이상 정확했다. 또 일부 고도에선 정확도가 99.7% 달했다.
구글은 이후 뉴럴GCM을 추가로 개발했다. 해당 모델은 비용 효율을 높인 것이 특징이다. 미국 국립해양대기청(NOAA)의 기상 예측 모델이 37만7000줄에 달하는 코드가 필요한 데 반해,뉴럴GCM 모델링은 단 5500줄을 사용했다.
구글 딥마인드는 “일반 컴퓨터에서도 몇 분 만에 실행할 수 있다”고 강조했다. 엔비디아도 적극적이다. 엔비디아는 어스-2라는 플랫폼을 공개했다. 기후와 날씨를 더 빠르고 정확하게 예측할 수 있게 해주는 고해상도 시뮬레이션 플랫폼이다. 스탠 포시 엔비디아 지구시스템 모델 총괄은 한국기자단과 간담회에서 “기상을 연구한 지 30년이 넘었는데,지난 2년간 가장 크게 변화했다”면서 “생성형 AI는 기상관측의 게임체인저”라고 말했다. 특히 어스-2는 엔비디아의 기상예측 기술을 바탕으로 만들어진 ‘디지털 트윈’이다.
“중국 산맥 적설량 알면 한국 폭염 예측한다”
지구 대기환경을 실시간 시뮬레이션해 디지털 트윈으로 구현한다. 기상청 방식보다 1000배 빠르고,분석 대상 해상도 역시 10배 높일 수 있다는 설명이다. 엔비디아는 또 코디프라는 모델을 개발했다. 확산 모델링을 활용해 해상도를 더욱 키울 수 있다. 약 12.5배 더 높은 해상도다. 포시 총괄은 “AI의 기후 예측과 날씨 모델링은 빠른 속도로 진화하고 있다”며 “지난해가 특히 AI 기반의 기후 예측의 기념비적인 한 해였다”고 설명했다.
아울러 마이크로소프트는 2023년 1월 클라이맥스(ClimaX)라는 파운데이션 모델을 처음 공개한 바 있다. 해당 서비스는 지난해 크게 주목받았다. 작년 7~8월 한국은 며칠을 제외하고 줄곧 비가 올 것이라고 예보했기 때문이다. 두 달간 지속해서 비가 온 적은 없었다는 것이 과거 통계다. AI가 맞았다. 작년 여름 날씨는 평년보다 1도 높았고 비는 291㎜ 더 내린 것으로 집계됐다. 또 화웨이는 ‘판구 웨더’라는 모델을 내놓았다. 기존 모델보다 예측 속도가 1만배 빠르다고 회사 측은 설명이다.
국내에서도 시도는 이어지고 있다. 울산과학기술원(UNIST) 지구환경도시건설공학과 임정호 교수팀은 해수면 온도,토양 수분,적설 깊이,해빙 농도 등 전 세계 기후 요소들을 분석해 폭염 예측 AI 모델을 개발해 주목을 끌었다. 이를 통해 몽골 사막과 중국 톈산산맥의 적설 깊이가 국내 폭염일수 예측에 중요한 요소라는 점이 확인됐다. 쌓인 눈이 줄어들면 국내 여름 기온이 상승한다는 패턴을 파악한 것이다.
빅테크 기업이 날씨 산업에 관심을 가진 것은 시사하는 바가 크다. 일기예보가 공공서비스가 아닌 향후 수익원이 되는 서비스로 자리를 잡을 가능성이 높다고 보고 있는 것이다.