재난재해 데이터 #1
과학기술 4차인재양성과정
빅데이터 분석가 과정
GeoDesign Solution Engineer
석상묵 Manager
재난재해 데이터 수업이라 명명되어있기는 하나
오늘은 GIS의 개념을 집중적으로 보고, 오후에 4가지 정도 데이터 분석.
마지막에는 최근의 트렌드인 GeoAI를 설명하고 마칠 예정이다.
GIS Overview
John Snow's Cholera Map 에서 정보를 담은 지도의 개념이 시작되었다.
콜레라가 대기오염이 원인이라고 생각 하던 당시, 각종 대기오염 관련 정책이 전혀 효과가 없자
콜레라 사망자를 지도상에 점으로 찍어 나타내어 패턴을 보고자 하였고
콜레라는 수질오염으로부터 발생한다는 전제를 갖고 지도를 그리기 시작했다.
사망자가 몰린 지역에 특정 수도펌프가 있음을 찾아냈고, 특히 무더기로 죽어나간 지역의 수도펌프가 오염되었음을 발견했다.
1854, 그렇게 오래 되지 않았다.
21세기에 들어와서는 위성지도 위에 여러 종류의 map을 겹치고 hitmap, 수도펌프 위치를 겹쳐서 살펴볼 수 있게 되었다.
물론 지도상에서 연관이 있어 보이다고 하여 100% 연관성이 있다고 장담할 수는 없기에 관련 배경지식을 알고 또 분야에의 연구를 통해
직접적인 관련성은 밝혀내야 하기에 정보 분석은 그 이상의 일이지만 충분한 지표가 되어줄 수 있다.
Napoleon's March on Moscow 1812 - 1813
5가지 이상의 정보를 담은 복잡적인 3D그래프(날짜, 군대 수, 온도 등)를 지도위에 겹칠 수 있다.
GIS (Geographic Information System)
위치정보를 포함한 공간데이터를 저장, 관리, 분석, 처리하여 유의미한 공간정보로 변환하는 시스템
(IS : 데이터의 저장, 관리, 분석, 처리를 통해 유의미한 정보로 변환하는 시스템)
데이터 기반의 의사결정을 어떻게 하는지가 중요하고, 이에 대해 알아볼 것이다.
Data-Driven Decision Making
(도표)
GIS 활용 사례
인천 남동공단 화재 발생 이력 - 소방차가 출동했던 범위를 점으로 찍어 히트맵 표시했다.
이 중 압도적으로 출동 건수가 많았던 (타 센터 대비 세 배 이상) 센터의 출동건수만 살펴보았을 때
세 개의 센터가 고르게 공간을 맡아 담당할 것이라는 예상과 달리, 위 센터가 공단의 거의 절반 이상을 커버하고 있음을 찾아냈다.
특히 그 센터가 담당하고 있던 지역 중 출동거리 8분 이상 걸리는 곳의 피해수준이 치솟는 것을 발견하고
그보다 가까운 센터에서 출동해야 할 것을 너무 넓은 범위를 커버하다 보니 비효율적인 출동을 하고 있었음을 알 수 있었다.
Components of GIS
하드웨어 // GIS 운영을 위한 물리적 장비. PC, Server, Mobile, ...
소프트웨어 // 데이터의 저장, 처리, 분석을 위한 도구. DBMS, Analysis Tool, GUI, ...(오늘 실습에는 ArcGIS Pro)
데이터 // 지리적으로 참조된 공간 데이터. 2D/3D GIS 데이터, 이미지(영상), LiDAR, ...
조직 // GIS 운영 및 의사 결정을 위한 조직. GIS분석가, 행정 실무자, 인원, ...
Spatial Component
객체의 위치를 나타내는 요소 (Where is it?)
GIS 데이터는 모두 직간접적으로 공간적 요소를 포함
Attribute Component
객체를 설명하는 요소 (What is it?)
GIS의 Geographic Data는 벡터데이터와 래스터 데이터로 나뉜다.
벡터데이터는 공간데이터 안에 단순한 점, 선, 면 정보로 현실세계의 정보를 축척에 맞게 압축하여 나타내는 것.
래스터데이터는 벡터데이터에서 점, 선, 면으로 나타냈던 데이터를 픽셀로 나타낸다는 차이가 있다.
당연히 이 픽셀이 작아질수록 해상도가 좋음을 의미함. 둘 다 같은 정보를 담고 있지만 표현 형식에 따라 나타내기 유용한 정보가
다르기 때문에 원하는 상황에 따라 서로 다른 데이터 타입을 사용하면 된다.
Vector Data Structure
: Spatial Component와 그에 해당하는 Attrbute Component가 쌍으로 붙어있다.
Raster Data Structure
: 연속된 표면들을 픽셀로 표현할 때 유용하다. (ex.hitmap) 하나의 면이나 선으로 나타내기 어려운 경사도 정보 등.
각 셀 값(cell value. 각 픽셀 안의 값)은 관측 값을 나타낸다
Spatial Analysis
Proximity : 인접성. 가스 유출 사고 시 풍향 등을 고려하여 사람들의 피난 시뮬레이션을 짤 때.
Overlay : 중첩데이터 연구. 전국적으로 특정 데이터들을 수집하다 보면 정보가 빈 곳이 발생할 수 밖에 없는데,
LA 천식환자 사례의 경우 6가지 정보를 중첩하여 비어있는 공간의 천식 환자 정보를 유추해내 빈 곳을 채워넣었다.
머신러닝과 매커니즘이 비슷하다 싶더라니 여기가 AI가 활용하는 분야라고 하며, 이 사례에서는 90%정도의 정확도를 가졌었다고 한다.
Network : 방과 방 사이 이동 네트워크. 다리가 불편하여 엘레베이터만 이용해야 할 때, 화재가 나서 계단만 이용해야 할 때 처럼 같은 상황에 대해 여러 제약조건을 줘서 걸리는 시간, 이동거리 등을 예측해낼 수 있다. 이런 실내공간 이동 네트워크는 세계적인 트렌드 중의 하나고 나아가서는 회사와 집 사이 경로 등 실내외 이동 네트워크까지 구현이 되고 활발히 활용 될 예정이다.
4 Elements of Map
Map Projection : 구형의 지도를 평면으로 폈을 때 나타날 수 있는 왜곡에 관한 것
Map Scale : 지도 축적
Generalizatin : 지도를 얼마나 상세하게 그릴 수 있는지에 대한 표준화 부분
Symbolization : 얼마나 지도 상의 정보를 효과적으로 나타낼 수 있는지에 대한 심볼라이즈.
Map Projection
실제 지구에 가장 가까운 Actual Earth
측량 등 중요한 작업때는 Geoid
일반적인 경우 Ellipsoid (lat, long) 일반적으로 표준화 시켜 나타낸 타원형의 지도
Planar Coordinates (ft,km) 우리가 접할 수 있는 대부분의 데이터 형태. 좌표 정보 등이 담겨있다. Ellipsoid를 보자기로 쌌다가 폈다고 생각해보면 접혀있던, 구겨져있던 부분에 데이터 중첩으로 오차가 많이 발생하게 된다.
Map Scale
Large scale ---1:10,000---Medium scale ---1:300,000---small scale
아무리 잘 그려도 25cm정도의 오차가 난다고 하며, 소축적으로 갈수록 오차가 커질 수 밖에 없게 된다.
1:1 Scale이라는 개념으로 존재하는 것이 있다. 대표적인 개념이 지적. 오차가 나면 수많은 문제가 발생하는 케이스.
(내 땅에 대한 권리를 가졌음을 나타내는 것이 지적도) 이 지적경계의 경우 예를 들자면 네덜란드에서는 1:1 맵으로 관리한다.
종이 대장인데 각 꼭지점, 각각의 길이 등을 전부 수치를 기록해서 모든 정보를 기록한 종이지도로 관리한다.
Generalization & Symbolization
지도상에 물체, 위치 등을 점, 선 면, 색의 농도 등 어떻게 나타낼지를 표준화 하는 작업,
예를 들자면 공항을 비행기 모양으로 나타내는 등의 표준화 작업이 Generalization이라면
이를 어떻게 더 효과적으로 나타낼 것인지. 사람들이 이해하기 쉬운 색깔, 형태로(선도 점선, 실선 등) 나타내고자 하는게 Symbolization
What is Web GIS?
국내 GIS 도입 배경 : 서울시 아현동 가스 폭발 (1994.12.07), 대구 지하철 공사 현장 가스 폭발 (1995. 04. 28)
제 1차 국가지리정보체계 (NGIS) 기본계획 수립 (1995)
도시정보시스템 (UIS; Urban Information System)
국내 GIS의 경우 위치정보를 기준으로 정보를 저장하고 관리했다. 미국이 상수도 배관을 관리할 때 용량을 중요시하여 기록하고 관리한다면 우리나라는 시작 사례가 사례다 보니, 또 공무원들이 기존의 예산 안에서 데이터베이스를 만들고 시스템을 구축해 활용하려다보니
아쉽지만 위치중심으로만 구성이 되어 실제 사용할 수 있는 정보가 많지가 않음.
그렇게 관리되어 오다가 스마트시티 (Smart City)가 화제로 떠오르게 된다.
기존에 데이터 관리가 저렇게 되다 보니 크게 분석할 수 있는 정보가 없다. 그런데 스마트 시티의 개념을 보자면
Sustainable, Well-Run, Livable, Healthy, Safe, Prosperous 등의 키워드를 가지는데
GIS는 앞서 말했듯 기존의 데이터도 굉장히 중요하고, 그걸 잘 운용하여 관리할 운영집단이 매우 중요하다.
데이터의 미비를 IT 기술로 극복해보겠다는 움직임이 일고 있고 여러 신도시가 개발은 되고 있으나, 기술적인 면보다
데이터를 쌓고 관리하는 것 부터 제대로 이루어져야 한다는 지적이 끊임없이 나오고 있다.
Web GIS // 데스크탑 GIS, 서버GIS, 분산GIS, 웹GIS
keyword :: 통합 (Integration) & 협업 (Collaboration)
Real-time GIS (Type of observation data)
: 이동체, 고정 자산(관측값이 변하는 고정된 센서), 상황 인식(특이사항 발생 시 지도에 표시)
Real-time Mobility Tracking - 이동중인 순찰차, 구급차에 주변 긴급상황 알림 및 최단경로 안내
Water Quality Dashboard - 실시간으로 수질에 문제가 생긴 지역 tracking, 문제되는 박테리아 관측
시계열(time-series) 빅데이터
: 현재 GIS에서의 빅데이터는 이런 데이터 수집 및 표시 시간의 단축을 의미하지 완전히 다른 방식을 의미하지는 않는다.
시간별로 낙뢰가 떨어진 지역들이 표시되는, 움직이는 gif이미지를 보여주심. 시간에 따라 지도에 표시되는 부분이 달라지는게 보임.
실습
ArcGIS Pro 체험판으로 실습을 진행한다. 데이터파일은 강사님에게 제공받음.
Site Selection
Buffer Analysis
범위에 해당하는 분석. 반경 이내의 정보를 표시하는 데에서 흔히 보던 것이 이 버퍼 분석이다.
(ex. 스타벅스의 일정 반경 이내에 이디야 커피숍이 있다?)
각 레이어에 대해 buffer를 수행하고, 합치고 싶은 버퍼 레이어들을 union 툴로 합친 뒤 dissolve 하면 범위들을 모두 묶어준다.
저장한 프로젝트는 웹에 연동시키면 내 콘텐츠에서 확인할 수 있고, 보여지는 방식을 편집할 수 있다.
또한 업데이트된 피쳐를 반영할지 아닐지, 편집을 허용할지 등도 설정이 가능하기 때문에
실시간으로 반영되는 인구변화 등을 반영해서 웹에서 보는 것이 가능하다.
Hotspot Analysis
( 시간 부족으로 Spatial Relationship은 스킵)
GeoAI
AI (Artificial Intelligence) > ML (Machine Learning) > DL (Deep Learning)
GeoAI가 활용되고 있는 분야
1. Classification : 학습 데이터 기반의 관심 객체 추출
ex. 지표면의 불투수층 추출을 통해 폭풍 및 홍수 발생 취약 지역 탐색
2. Clustering : 관측 값 또는 공간적 유사성을 기반으로 데이터 클러스터링
ex. 오후 5-6시 사이의 50,000개의 교통 현황 자료로부터, 현재 교통 체증 지역에 대한 정보 수집이 가능한 지역 탐색
3. Prediction : 특정 지역에 대한 비지의 관측 값 추정
ex. 기후 변화가 지역별 기온에 미치는 영향 예측
< 이 아래 내용에 관해서는 시뮬레이션 영상을 보여주심 >
교통 정보를 예측하거나,
Deep Learning (CNN)을 활용한 Object Detection을 GIS와 접목하여 건물 수 변화 등을 확인 가능함.
움직이는 영상에서의 자동차 detection 역시 차량의 이동량 등을 영상으로부터 실시간 관측할 수 있다.
또 도착시간 예측에도 쓰인다. 내비게이션의 통행량 역시 예를들면 SK 통신망을 사용하는 사람들의 위치정보를 수집하여 파악하는 것.
ex. KISTI - 3D Flood Impact Analysis
레이저로 건물에 꽂을 경우 각 고도값을 갖는 수천억개의 레이저 점들이 생기며 그 shape으로 건물이 얼마나 있는지, 얼마나 높이 있는지를 알 수 있고 이를 기반으로 건물을 3D 모델링 할 수 있게 되며 시간별 햇빛 고도에 따른 그림자 변화 역시도 볼 수 있게 된다.
이런 건물과 수목 등의 모델링을 인천광역시에서 진행하고 있고 KISTI에서는 이 모델과 침수되었던 정보를 기반으로,
실제 지도에서 어느 지역이 얼마나 침수가 되는지 연구를 바탕으로 시나리오를 반영할 수 있게 되고 어디로 대피하는 것이 최선인지를
분석하여 공공기관에 전달하는 식으로 협업이 이루어지고 있다.
침수처럼 땅 위의 결과 외에도 땅 밑의 값을 분석한 것들도 3d 지도에 반영할 수 있다.
ex. GIS를 활용한 3D 조감도
스마트 시티 계획에 GIS를 활용하는 방안. 기존의 고정된 조감도로 알 수 없는 부분까지
구체적으로 시뮬레이션이 가능하다.