/ DATA-SCIENCE

Python 데이터분석 라이브러리(2) - NumPy(Exercise)

Data-Science 강의는 여러 절로 구성되어 있습니다.


NumPy Exercise - 1

NumPy의 기능을 숙지하기 위해 기상자료개방포털 홈페이지에서 기상관련 데이터를 제공받아 데이터 분석을 하는 실습을 진행합니다.

기상자료개방포털

CSV 파일 다운로드

기후통계분석 > 통계분석 > 기온분석

위의 메뉴로 들어가서 기간을 설정하고(1904년1월1일~최근) 지역은 서울을 설정합니다. (아래의 문제를 풀기 위해서 대구 지역의 파일도 받아야 합니다.)

검색버튼을 누르고 잠시 기다리면 그래프가 출력됩니다. 그 후 CSV 다운로드 버튼을 클릭해 데이터 파일을 다운로드 받습니다.

다운로드한 CSV 파일

다운로드한 후 CSV 파일을 Notepad++ 같은 에디트 프로그램으로 열고 1~7행을 삭제합니다.

NumPy를 이용하여 다음의 내용을 구합니다. 데이터에 결측치가 포함되어 있을 수 있습니다. 주의하세요!! (중복된 내용이 있으면 모두 출력하며 오름차순으로 정렬하여 출력합니다.)

  • 기상 관측 이래, 서울의 최고 기온이 가장 높았던 날은 언제였고, 몇도인가요?

  • 역사적으로 일교차가 가장 큰 날짜는 몇년 몇월 몇일 인가요?

  • 1년 중 평균적으로 일교차가 가장 큰 날짜는 몇월 몇일 인가요?

  • 가장 덥다고 알려진 대구보다 서울이 더 더운날이 가장 많은 연도는 언제인가요?

End.


Data-Science 강좌는 아래의 책과 사이트를 참조했습니다. 조금 더 자세한 사항을 알고 싶으시면 해당 사이트를 방문하세요!!