1. 지방자치단체별 저출산 지표 및 시사점 1

국회 입법조사처에서 “지방자치단체별 저출산 지표 및 시사점” 제목의 보고서를 발간하였다. 이를 바탕으로 다수 언론사에서 이를 바탕으로 기사를 다수 제작하여 보도했다.

국회입법조사처에서는 2014~2016년 지방자치단체별 저출산 대응 자체사업 소요예산 비율과 합계출산율이 양(+)의 상관관계(r=0.6637)가 있는 것으로 나타났기 때문에, 저출산문제를 해결해나가는 방법으로 “저출산 대응 자체사업 소요예산”을 증가하는데 각 지자체별로 효과를 극대화하는데 조달된 예산을 효율적인 사용을 강조하고 있다.

2. 저출산 대응 자체사업 소요예산 비율과 합계출산율이 양(+)의 상관관계인가?

2014~2016년 지방자치단체별 저출산 대응 자체사업 소요예산 비율 데이터와 합계출산율 데이터를 시도별로 취합하여 이를 바탕으로 양의 상관관계가 나왔다는 사실에 기초해서 정부정책 방향과 각 지자체 추진 정책에 대한 방향을 제시하고 있다.

저출산 대응 자체사업 소요예산 비율과 합계출산율의 상관관계

기초 통계학 지식을 갖추고 한국 시도별 인구구성에 대한 기초 정보를 갖고 있다면 한 눈에 “저출산 대응 자체사업 소요예산 비율과 합계출산율의 상관관계” 다음 그래프가 잘못된 것이라는 것을 파악할 수 있다.

왜냐하면 세종과 제주는 매우 특별한 시도로 출산관련 대한민국을 대표하는 대표성에 문제가 있기 때문이다. 특히 회귀분석은 최소자승법에 기초하기 때문에 양극단 값을 과대계상하는 문제가 있다는 것은 잘 알려진 사실이다. 따라서, 세종시가 포함되어 전반적으로 저출산 대응 자체사업 소요예산 비율을 높이면 합계 출산율이 높아지는 착시 현상이 발생했다.

3. 국회입법조사처 회귀분석 재구성

국회입법조사처 회귀분석에 사용된 데이터를 구할 수가 없어서 인터넷을 통해 공개된 보고서의 그래프를 바탕으로 데이터를 추출하여 분석결과를 재구성해보자.

3.1. 산점도에서 데이터 추출

WebPlotDigitizer를 활용해서 원그래프에서 데이터를 추출하여 데이터프레임으로 재구성한다. digitizeR 팩키지를 설치하고 나서, wpd.launch() 명령어를 실행하게 되면 복잡한 그래프에서도 원데이터를 쉽게 추출할 수도 있다. 또한, 과학기술 종사자면 누구나 친숙한 R을 사용했기 때문에 plot.ly에도 연결시켜서 추출한 데이터가 제대로 추출되었는지 클릭 몇번으로 확인이 가능하다.