기후재난리포트12 ⑤ 태풍 | 태풍 예보의 한계, AI가 극복할 수 있을까?
- Theodore

- 7월 25일
- 9분 분량
2025-07-25 최민욱 기자

기상예측정확도, 국가 재난 대응의 핵심 역량
태풍은 선행 예측시간을 두고 접근하는 자연재해다. 위성 영상, 해양 관측, 기압 분석 등을 통해 이동 경로와 강도를 사전에 추적할 수 있다. 발생은 불가피하지만 피해는 관리 가능하다는 점에서, 태풍은 대응 여하에 따라 피해 규모가 결정되는 재해이다. 통계가 이를 입증한다. 2002년 태풍 루사는 전국적으로 약 5조 원 이상의 재산 피해를 남겼고, 이듬해 태풍 매미는 4조 원에 가까운 손실을 초래했다. 두 사례 모두 상륙 전 기압과 진로를 비교적 조기에 인지했음에도, 강풍과 해일 대비가 부족했던 점이 피해 확대의 핵심 원인이었다. 피해의 대부분은 인명 손실보다 전력·통신 기반시설, 농작물, 산업단지에서 발생했다.
태풍은 상륙 전 수십 시간 동안 경로 예측이 가능하기 때문에, 기상 예보의 정확도가 곧 대응 효율성과 직결된다. 진로가 수십 킬로미터만 벗어나도 대피 권역이 바뀌고, 산업시설의 셧다운 여부나 군·소방 대응 범위가 달라진다. 예측은 단순한 정보 제공을 넘어, 자원 배분과 물자 투입의 기준을 결정하는 도구다.
기상청과 재난안전본부, 지자체 방재 조직은 태풍 경보가 발령되면 기상청의 수치예보 모델 결과를 기반으로 대응 시나리오를 가동한다. 잘못된 예보는 재난 대응 타이밍을 놓치게 만들고, 과잉 예보는 불필요한 셧다운과 경제 손실을 유발한다. 예보의 정밀도는 재난 대응 시스템의 신뢰성을 좌우하는 핵심 지표다.
2020년 마이삭과 하이선, 예측과 대응 실패가 남긴 교훈
2020년 가을, 연이어 한반도에 접근한 태풍 마이삭과 하이선은 태풍 예측 시스템의 구조적 한계를 드러낸 사례로 평가된다. 두 태풍 모두 한반도에 중대한 영향을 끼쳤고, 예보 초기 단계부터 다수의 오차가 발생했다. 예측 실패는 재난 대응의 혼선을 유발했고, 실제 피해를 증폭시키는 요인으로 작용했다.
태풍 마이삭은 9월 3일 오전 강원도 동해안으로 상륙했지만, 기상청의 초기 예상 진로는 남해안 상륙 후 경북 내륙을 관통하는 경로였다. 예보는 태풍이 제주도 남서쪽을 지나 전남 지역에 근접할 것으로 가정했으나, 실제로는 제주 남동부를 지나 부산 인근으로 북상했다. 중심기압과 강풍 반경 예측도 초기보다 과소평가되었고, 상륙 시점은 예보보다 약 3~4시간 앞당겨졌다. 이로 인해 울산·경주·부산 지역에서는 태풍 대비 매뉴얼 가동 시점이 늦어졌고, 항만 및 철도 인프라 피해가 집중되었다. 부산항의 경우 컨테이너 크레인 운영 중단 시점이 늦어져 장비 손상이 발생했고, KTX 운행 중단 결정도 예상보다 급작스럽게 이뤄졌다.

태풍 하이선의 경우 예측 오차가 더 뚜렷했다. 기상청은 초기 단계에서 하이선이 남해안에 상륙해 내륙을 북상할 것으로 전망했지만, 태풍은 동해안 해상을 따라 북상하며 육지와는 일정 거리를 유지했다. 이로 인해 경남 서부와 대구·경북 지역에서는 필요 이상의 대피령과 공공시설 폐쇄가 발생했다. 반면, 실제 피해가 집중된 강원 영동과 포항 지역에서는 일부 대응이 지연되었다.
태풍 종료 이후 베스트트랙 분석 결과, 기상청이 사용한 예보모델에서 태풍 중심 위치 추정에 반복적인 오류가 있었음이 확인되었다. 동일한 태풍을 두고 미국 NHC와 일본 JMA가 제시한 경로 예측은 한국 기상청보다 상대적으로 정확한 경향을 보였다. 특히 일본은 하이선이 내륙보다는 동해안 해상을 따라 북상할 가능성을 조기부터 제시했고, 미국은 태풍 중심기압 강도 예측에서 국내 모델보다 낮은 오차율을 보였다. 한국의 수치예보모델은 강도보다는 진로 예측에서 오차가 컸으며, 중심 이동 속도에 대한 시간 단위 예보 또한 실측과 차이를 보였다.
세계 주요 기상기관의 수치예보모델
세계 주요 기상기관은 수치예보모델을 활용해 예보를 생산하고 있으며, 그 모델의 구조와 운영 방식은 국가마다 상이하다.
유럽의 ECMWF는 높은 정확도를 유지하는 중기 예보모델을 운영한다. 이 기관은 34개 회원국의 공동 재정과 슈퍼컴퓨터 자원을 통해 지구 전역의 고해상도 수치예보모델(HRES)을 운용하고 있으며, 10일 범위에서 예측 정확도가 타 모델 대비 평균 10~15% 높다는 평가를 받는다. 연산 격자는 9㎞ 수준이며, 전 지구에서 수집한 위성·지상 자료를 통합하는 독자적인 자료동화 시스템을 갖추고 있다.
미국은 NCEP 산하의 GFS(Global Forecast System) 모델을 운영하고 있으며, 태풍 예측에서는 NHC(국립허리케인센터)가 별도의 정제 작업을 수행한다. 미국의 예보는 다중모델 기반 예측과 예보관의 주관적 조정이 결합된 구조로, 앙상블 분산도와 통계적 오차 범위를 병행 제공한다. 태풍 예보 시 진로 추적은 JTWC(합동태풍경보센터)와 연계되며, 정량적 경고 기반 운영 시스템을 갖추고 있다.
일본 기상청은 JMA 글로벌 모델과 지역 모델을 운용하면서, 서태평양 지역에 특화된 태풍 진로 예측 알고리즘을 개발해 활용 중이다. 일본은 한반도 인근 해역의 위성 해상 관측 비중이 높고, 태풍 중심 추적 알고리즘 정교화에 장기간의 투자와 인력이 집중되었다. 평균 진로 예측 오차는 3일 기준 150㎞ 이내이며, 최근 5년간 성능 향상이 지속적으로 보고되었다.
한국 기상청은 2020년 KIM(Korea Integrated Model)을 도입해 독자적인 예보체계를 구축했다. KIM은 2010년부터 사용하던 영국 기상청의 UM(United Model) 기반 모델에서 벗어나, 국내 기술진이 전면 개발한 한국형 전 지구 수치예보모델이다. 해상도는 최근 약 8㎞ 정도로 향상되었으며, 국산화된 자료동화 시스템으로 위성, 지상관측, 항공기, 레이더 등 다양한 관측 자료를 융합한다. KIM은 전 지구 앙상블 예보 기반 확률정보 제공뿐 아니라, 지역모델(LDAPS, RDAPS)과 연계한 고해상도 예보의 기초를 형성하며, 태풍·호우 등 고위험 기상의 예측 정확도 향상에 기여하고 있다.
수치예보모델의 작동 원리와 한계
기상청의 태풍 예보는 수치예보모델(Numerical Weather Prediction, NWP)에 기반해 생산된다. 수치예보모델은 대기의 상태를 수학 방정식으로 구성하고, 고성능 컴퓨터를 통해 시간에 따른 대기 변화 과정을 계산한다. 이는 전 지구적 기압, 온도, 습도, 풍속 등의 데이터를 초기 조건으로 설정한 뒤, 물리 방정식을 해석해 미래 상태를 모의하는 방식이다.
수치예보는 '초기장', '모델 물리방정식', '계산격자 해상도'라는 세 가지 핵심 요소에 따라 성능이 결정된다. 초기장은 관측 자료를 기반으로 설정되며, 위성, 라디오존데, 선박, 지상기상관측소, 항공기 자료 등이 활용된다. 초기값이 부정확하거나 누락될 경우, 이후 계산 결과는 빠르게 오차를 증폭시킨다. 태풍 중심이 해양 상공에 있을 경우, 관측자료가 희박해 중심 위치와 강도를 정확히 파악하는 데 어려움이 따른다.
모델에 내장된 물리방정식은 난류 확산, 구름 생성, 복사, 대기 대순환 등을 수치적으로 근사하는 역할을 한다. 그러나 기상현상은 본질적으로 비선형적이며, 시간과 공간의 미세한 차이가 전체 흐름에 큰 영향을 끼친다. 이로 인해 동일한 조건에서 다른 수치모델은 서로 다른 결과를 낼 수 있다. KIM처럼 특정 지역 특성을 반영한 모델도 존재하지만, 미국 GFS나 유럽 ECMWF처럼 장기간 누적 검증된 글로벌 모델에 비해 자료동화 및 물리모형의 정합성이 부족하다는 평가가 있다.
해상도 역시 중요한 요소다. 태풍의 중심과 강풍반경은 수십 킬로미터 단위로 좁은 영역에 집중된다. 예보모델의 격자 간 간격이 10㎞를 넘을 경우, 태풍 중심의 이동이나 강도 변화를 제대로 포착하지 못한다. 고해상도 모델은 연산 비용이 기하급수적으로 증가하기 때문에, 예보 기간과 연산 자원의 균형 속에서 타협이 불가피하다.
이처럼 NWP는 태풍의 진로와 강도를 정량적으로 계산할 수 있는 유일한 방법이지만, 관측 자료의 제약, 모델의 이산화 오류, 계산 자원의 한계 등으로 인해 오차가 불가피하게 발생한다. 특히 태풍과 같은 고에너지 국지현상은 이러한 한계가 응축된 사례로, 단기예보에서조차 중심 예측 오차가 수십 킬로미터에 달하는 경우가 적지 않다.
AI 기상예보 모델의 등장
전통적인 수치예보모델은 대기현상을 수식화하고 이를 해석하는 방식으로 작동한다. 이 방식은 과학적 타당성과 예측 근거를 갖추고 있지만, 계산 과정이 복잡하고 시간과 자원이 많이 소요된다. 또한 관측 자료의 희소성, 초기장 오차, 물리모형 불확실성 등으로 인한 예보 오차는 일정 수준 이하로 감소되지 않는 한계가 존재한다.

기상청과 국제 기상기관들은 수십 년 간 수치모델 성능 향상에 집중해 왔지만, 최근 10년간 예보 정확도의 증가폭은 정체에 가까운 수준을 보였다. 특히 태풍처럼 공간 규모가 작고 이동이 빠른 기상현상은, 모델의 격자 해상도와 연산 주기 한계에 의해 예측력이 제한된다. 5일 예보 이후의 진로 오차는 수치적으로 300㎞ 이상 벌어질 수 있고, 강도 예측도 중심기압 기준 10hPa 이상 편차가 빈번히 발생한다. 또한 수치예보모델은 예보 1건당 몇 시간 이상의 슈퍼컴퓨터 연산을 필요로 한다. 대규모 앙상블 예보와 고해상도 국지 모델을 병행할 경우, 전력 소모와 자원 투입이 급증한다. 이런 구조는 기상기관의 운영 부담을 높이고, 실시간에 가까운 고빈도 예보 생산을 어렵게 만든다.
이러한 기술적·운영적 한계를 인식한 국제 연구기관과 기상청들은, 기계학습과 인공지능을 새로운 예보 기법으로 검토하기 시작했다. AI는 방대한 기상 자료로부터 통계적 패턴을 학습하고, 입력 자료의 변화에 따라 비선형적 결과를 즉시 출력할 수 있다. 특히 반복적인 대기 진화를 빠르게 계산해 단시간 내 전 지구 예보를 산출하는 것이 가능하다.
AI 기반 예보모델은 기본적으로 과거 수십 년간의 관측 자료와 기존 수치모델 출력 결과를 학습 대상으로 삼는다. 이 데이터 기반 예측 구조는 물리 법칙을 직접적으로 해석하지 않지만, 축적된 기상현상 간 상관관계를 활용해 예보 정확도를 높인다. 일부 선진 기관은 AI가 수치모델을 보완하는 '후처리' 기능을 넘어, 독립된 예보 생성도 가능한 단계로 전환하고 있다.
결정적으로 AI 도입의 가장 큰 동인은 '속도'와 '비용'이다. 기존 모델이 수 시간 걸리던 계산을 AI는 수 분 안에 완료할 수 있고, 대규모 인프라 없이도 예보 생산이 가능하다. 이러한 구조는 예보 생산 체계를 효율화하고, 예보의 갱신 빈도를 획기적으로 높일 수 있는 조건을 제공한다.
AI는 기존 수치모델을 어떻게 보완하는가
AI 기반 기상예보는 수치예보모델의 구조적 한계를 보완하는 기술로 발전하고 있다. 대표적인 적용 방식은 학습 기반 예보 생성, 예보 후처리 보정, 다중모델 조합 최적화다. 이 방식들은 공통적으로 물리 방정식의 수치 해석 대신, 기상변수 간의 패턴을 기계학습 알고리즘이 자동 추출하는 구조를 따른다.
2023년 유럽 ECMWF는 'AIFS(Artificial Intelligence Forecasting System)'라는 이름의 AI 기반 예보시스템을 실험적으로 운용하기 시작했다. 이 시스템은 6시간 간격의 기상 자료를 입력받아, 최대 15일 후까지의 중기 예보를 생성한다. 초기 평가 결과 AIFS는 유럽 운영 수치모델(HRES) 대비 전 지구 평균 예보 정확도에서 약 10~20% 향상된 성능을 보였다. 특히 태풍과 열대성 사이클론의 진로 예측에서는 기존 대비 최대 12시간 빠르게 위험 지역을 식별할 수 있었다.
딥마인드가 개발한 '그래프캐스트(GraphCast)'는 AI 예보모델이 독립적 예보 생산 도구가 될 수 있음을 실증한 사례다. 그래프캐스트는 지난 40년간의 ERA5 기후 재분석 자료를 학습한 뒤, 시계열 그래프 구조를 통해 대기 상태를 예측하는 모델이다. 테스트 결과, 그래프캐스트는 기존 ECMWF HRES 모델보다 약 90% 이상의 평가 항목에서 예측 정확도가 우수했고, 일부 고도 영역에서는 99% 이상의 상관성을 보였다. 모델 계산 시간은 1분 이내로, 기존 수치모델 대비 수십 배 빠르다.
화웨이가 개발한 '판구 웨더(Pangu-Weather)' 모델 역시 대기 전층에 걸친 기온, 바람, 강수량 예측에서 기존 수치예보모델과 유사하거나 높은 성능을 보였다. 이 모델은 특히 고도별 격자 해상도 조절 기능을 갖추고 있어, 대류권 내 정밀 예측에서 효율적이다. 미국 캘텍과 NVIDIA가 공동 개발한 'FourCastNet'은 20㎞ 해상도 전 지구 예보를 기존보다 5만 배 빠른 속도로 생성하는 데 성공했다.
이들 AI 모델은 학습 기반으로 구성되기 때문에 기존 모델보다 구조가 단순하고, 연산 시간과 에너지 소모가 크게 줄어든다. 예측을 반복 수행하는 데 드는 비용이 낮아져, 하루 수십 회의 예보 갱신이 가능해진다. 결과적으로 빠른 주기로 예보를 갱신하면서 급격한 기상 변화에 실시간 대응할 수 있는 환경이 조성된다.
또한 AI는 수치모델에서 나타나는 체계적 편향을 보정하는 데 강점을 보인다. 예를 들어, 수치모델이 특정 해역에서 지속적으로 기압을 과소예측하는 경향이 있을 경우, AI는 과거 자료를 학습해 이를 자동 보정한다. 이 보정기능은 단기 강수량, 지역별 풍속, 태풍 중심기압 등 정량 수치 예측에서 유용하게 활용된다.
AI는 예보관의 판단 보조 도구로도 기능할 수 있다. 태풍 중심 자동 추적, 위성 영상 기반의 구름 패턴 분석, 강수 시작 시간 예측 등 세부적인 분석 작업을 빠르게 수행함으로써, 예보관이 정성적 판단에 집중할 수 있는 여건을 만든다. 2023년부터 기상청도 위성자료 기반 태풍 중심 추적 AI를 운영에 일부 도입했다.
한국 기상청의 AI-하이브리드 전략
한국 기상청은 AI 기반 예보의 기술적 가능성과 구조적 한계를 모두 인식하고 있으며, 기존 수치예보모델과 인공지능 기술을 병합하는 방향으로 예보 체계를 개편하고 있다. 완전한 자동화보다는 예보관과 AI가 협업하는 형태의 운영 전략이 중심에 있다.

기상청은 2019년부터 'AI 예보관 알파웨더(AlphaWeather)' 개발을 시작했다. 이 시스템은 초단기 기상예보의 분석과 자료 수집을 자동화하고, 예보관의 판단을 보조하는 기능을 수행한다. 1단계로 개발된 알파웨더는 예보관이 수작업으로 조회하던 수치모델 결과, 관측자료, 위성영상 등을 통합 정리해 제공하며 정보 누락 가능성을 감소시켰다. 2단계에서는 기상 현상의 지역별 특성에 따라 발생 가능성 분석을 AI가 자동으로 수행하며, 3단계에는 생활밀착형 기상정보 제공을 목표로 하고 있다. 최종적으로는 예보관이 작성한 예보문과 AI 예측 결과를 비교해 정합성을 검토하고, 상호 보완적인 수정을 거쳐 최종 예보를 산출하는 방식이 적용된다. AI의 출력은 예보 초안으로 사용되며, 최종 판단과 발표는 예보관의 책임 하에 이뤄진다.
한편, 기상청은 중장기 전략으로 '국가 기후예측시스템 개발사업'을 본격 추진 중이다. 2025년부터 7년간 총 495억 원 규모로 진행되는 이 사업은 1개월에서 10년 후까지의 기후를 예측하는 통합 지구시스템모델을 구축하는 것을 목표로 한다. 사업에는 서울대학교, UNIST, 국립기상과학원 등 10여 개 연구기관이 참여하며, 대기·해양·빙권·토양·생태계 요소를 통합한 다중 모듈 시스템이 개발된다.
이 시스템에는 수치예보 기반 지구모델뿐 아니라, AI 예측 기술도 병행 적용된다. 기상청은 "기존 수치모델 기반 예측시스템을 고도화하면서, AI 기반 분석과 사용자 맞춤형 정보 제공 체계를 통합할 계획"이라고 밝히고 있다. 이 접근은 기존 모델의 물리 기반 신뢰성과 AI의 계산 효율을 결합한 하이브리드 구조로, 국제 기상기관들이 시도 중인 방향성과 유사하다. 기상청은 AI는 예보 정확도 향상을 위한 도구이지, 수치모델을 대체하는 시스템은 아니라는 인식을 갖고있다. AI가 갖는 기술적 강점을 적극 활용하되, 예보관의 경험과 수치모델의 검증 구조를 유지하는 방식으로 예보 체계의 신뢰성을 강화하려 한다.
AI 예보의 한계와 과제
AI 기반 기상예보가 기존 수치모델의 한계를 보완하는 기술로 주목받고 있지만, 여전히 해결해야 할 구조적 문제들이 존재한다. 이러한 한계는 AI 예보 기술의 확산과 실용화에 중요한 제약 요소로 작용하고 있다.
첫 번째 한계는 학습 데이터의 의존성이다. AI 모델은 과거 기상 자료를 학습해 패턴을 추출하는 방식으로 작동하기 때문에, 과거에 발생하지 않았거나 매우 드문 기상현상에 대해서는 예측 능력이 제한적이다. 특히 기후변화로 인해 기존과 다른 양상의 극한 기상현상이 나타나는 경우, AI는 적절한 대응을 하지 못할 가능성이 높다. 태풍의 경우도 최근 발생 빈도가 증가하고 있는 '급속강화' 현상 같은 새로운 패턴에 대해서는 충분한 학습 사례가 부족해 예측 정확도가 떨어질 수 있다.
두 번째는 물리적 해석 능력의 부재다. 수치예보모델은 대기 역학과 열역학 법칙에 기반해 예보를 생성하기 때문에, 예측 결과에 대한 물리적 근거를 제시할 수 있다. 반면 AI 모델은 통계적 상관관계를 바탕으로 결과를 도출하기 때문에, 왜 그런 예측이 나왔는지에 대한 명확한 설명이 어렵다. 이는 예보관이 AI 결과를 신뢰하고 활용하는 데 장애 요소가 된다. 특히 예상치 못한 결과가 나올 경우 그 타당성을 검증하기 어려워, 운영상 리스크가 발생할 수 있다.
세 번째는 극한 기상현상에 대한 예측 능력이다. AI 모델은 일반적인 기상 패턴에서는 우수한 성능을 보이지만, 태풍이나 집중호우 같은 극한 현상에서는 여전히 한계를 보인다. 이는 극한 현상의 발생 빈도가 낮아 충분한 학습 데이터를 확보하기 어렵고, 이러한 현상들이 비선형적 특성을 강하게 보이기 때문이다. 실제로 그래프캐스트나 판구 웨더 같은 AI 모델도 열대성 저기압의 급속 발달이나 경로 급변 상황에서는 기존 수치모델과 유사한 수준의 오차를 보이는 것으로 보고되고 있다.
네 번째는 지역 특성 반영의 어려움이다. 한반도는 복잡한 지형과 삼면이 바다로 둘러싸인 독특한 지리적 특성을 갖고 있어, 태풍의 진로와 강도 변화에 지역적 요인이 크게 작용한다. 글로벌 AI 모델들은 전 지구적 패턴 학습에는 우수하지만, 이런 지역 특성을 세밀하게 반영하는 데는 한계가 있다. 한국형 AI 모델 개발이 필요한 이유기도 하다.
다섯 번째는 실시간 관측 자료 통합의 문제다. AI 모델은 일정한 시간 간격으로 제공되는 기상 자료를 기반으로 학습되지만, 실제 태풍 상황에서는 항공기 관측, 드롭존데, 위성 특별관측 등 다양한 실시간 자료가 추가로 수집된다. 이런 불규칙한 관측 자료를 AI 모델에 효과적으로 반영하는 기술은 아직 완전히 해결되지 않았다.
AI와 협업하는 태풍 예보의 미래
태풍 예보는 단순한 기술의 문제를 넘어 국가 안전과 직결되는 공공 서비스다. AI 기술이 아무리 발전해도 최종적인 판단과 책임은 인간이 져야 한다. 미래의 태풍 예보 체계는 AI의 계산 능력과 인간의 경험적 판단이 조화를 이루는 방향으로 발전할 것이다. AI는 방대한 데이터를 빠르게 처리하고 복잡한 패턴을 찾아내는 데 탁월하다. 반면 인간은 예외적 상황에 대한 직관적 판단과 사회적 맥락을 고려한 의사결정에 강점이 있다. 태풍처럼 생명과 재산에 직접적 영향을 미치는 기상현상의 예보에서는 이 두 가지 능력이 모두 필요하다.
한국의 태풍 예보 체계는 이제 새로운 전환점에 서 있다. AI라는 강력한 도구를 얻게 된 만큼, 이를 현명하게 활용해 국민의 생명과 재산을 보호하는 데 최선을 다해야 할 때다. 기술의 발전과 함께 예보관의 전문성도 함께 진화해야 하며, 무엇보다 기술에 대한 맹신보다는 검증된 방식으로 점진적 개선을 추구하는 자세가 필요하다.







AI기반 예측이 비용과 속도면에서 기존 수치예측모델에 비해 월등하지만 아직은 여러 한계를 가지고 있는 만큼, 보완수단으로 봐야 합니다. 언제가는 AI가 현재의 모든 한계를 극복하는 날이 오겠지요.