최근에 한빛미디어 신간인 나도 하는 파이썬 데이터분석을 읽었습니다.
드디어 제가 오랫동안 기다렸던 파이썬 기초 책이 출간되었습니다. 바로 한빛미디어 신간인 나도 하는 파이썬 데이터분석입니다. 제가 왜 이처럼 기다린 책인지 도대체 나도 하는 파이썬 데이터분석이 그렇게 수많은 파이썬 책이 출간되었음에도 불구하고 지금 이 시점에 유의미한지에 대해서 오늘 자세히 리뷰하도록 하겠습니다.
나도 하는 파이썬 데이터분석은 파이썬을 이용하여 도시 생활 데이터를 수집하고 분석하는 방법을 배울 수 있는 실전 지향적인 책입니다.
그런데 대부분의 사례를 활용한 책들은 기초를 생략하는 경우가 많고 또한 파이썬의 기본지식을 안다고 전제하에 책을 집필하는 경우가 많습니다. 그러다보니 개발에 대해서 완전히 모르는 초보자들이 보기에는 어려운 경우가 많습니다.
또한 대부분의 파이썬은 파이참이나 아나콘다와 같은 개발환경에서 쓰여진 경우가 많습니다.
하지만 비전공자들은 PC컴퓨터 앞에서 개발에 전념을 할 수 있는 시간이 그리 많지 않습니다.
대부분은 파이썬을 한번 배워볼까? 혹은 저처럼 교육현장에서 비전공자로서 데이터리터러시 관련 프로젝트를 진행하고 싶은데 한번 경험해보려는 상황이 많습니다. 이런 경우에는 PC컴퓨터를 그리 많이 하지 않습니다.
이런 경우 모바일로 파이썬 코딩을 하면 너무 좋은데, 그게 바로 구글 콜랩입니다.
하지만 대부분의 기존 파이썬 책들은 구글 콜랩을 활용하지 않습니다.
그러다보니 기존이 파이썬 책을 활용해서 구글 콜랩에 적용하려고 하면 처음에 라이브러리 모듈 불러오는 것부터 막히고, CSV 파일 불러오는 것부터 막힙니다.
결국 제대로 하지 못하게 되는 것이죠.
이러한 어려움이 많았는데 이번에 드디어 그동안 갈증을 완전히 해소해줄 파이썬 책이 등장한 것입니다.
바로 나도 하는 파이썬 데이터분석입니다. 그러면 구체적으로 나도 하는 파이썬 데이터분석에 대해서 살펴보도록 하겠습니다.
나도 하는 파이썬 데이터분석에 대해서 간략히 소개하면 다음과 같습니다.
나도하는 파이썬데이터 분석은 김규석과 김현정이 지은 파이썬을 이용한 데이터 분석 입문서입니다. 이 책은 구글 콜랩을 활용하여 도시 생활 데이터를 수집하고 분석하는 방법을 다양한 사례와 함께 설명합니다. 정형 데이터와 비정형 데이터의 수집 및 분석, 상관관계 분석, 회귀 분석, 시계열 분석 등의 주요 데이터 분석 기법을 쉽게 익힐 수 있습니다.
먼저 저자부터 살펴보도록 하겠습니다.
저자 김규석은 항공대와 아주대에서 학위를 받은 뒤에 서울대에서 박사를 수료했습니다. 다양한 기업 경험을 쌓은 뒤에 현재는 폴리텍 대학에서 조교수로 재직중입니다. 사회과학 분야 빅데이터에 관심이 많아 지속적으로 연구를 하고 있습니다.
김현정 저자는 현재 한동대 교수로 도쿄 대학에서 도시공학 박사학위를 취득했습니다. 서울대에서 강의도 하면서 스마트 시티 관련 국책 연구를 수행해왔습니다. 현재는 도시해석연구실을 운영하며 다양한 도시 빅데이터 분석을 하고 있습니다.
이 책의 대상독자는 데이터 분석에 관심이 있지만 파이썬이나 개발 환경에 익숙하지 않은 비전공자입니다. 이 책은 구글 콜랩이라는 온라인 개발 플랫폼을 활용하여 PC가 없어도 모바일로 파이썬 코딩을 할 수 있게 해줍니다. 따라서 출퇴근 시간이나 여가 시간에도 파이썬 데이터 분석을 공부할 수 있습니다. 이 책은 파이썬의 기본 문법부터 시작하여 도시 생활과 관련된 다양한 데이터를 수집하고 분석하는 방법을 단계별로 알려줍니다. 이를 통해 데이터 분석의 핵심 개념과 실무 능력을 습득할 수 있습니다.
나도 하는 파이썬 데이터분석은 파이썬을 이용하여 도시 생활 데이터를 수집하고 분석하는 방법을 배우는 책입니다. 이 책의 특징은 다음과 같습니다.
- 파이썬 기초부터 실전 예제까지 단계별로 설명합니다. 개발에 대해 모르는 초보자도 쉽게 따라할 수 있습니다.
- 구글 콜랩을 활용하여 PC가 없어도 모바일로 파이썬 코딩을 할 수 있습니다. 라이브러리 모듈과 CSV 파일을 불러오는 방법도 자세히 알려줍니다.
- 도시 생활과 관련된 다양한 데이터를 활용하여 실생활에 적용할 수 있는 인사이트를 얻습니다. 코로나 시대의 여행지, 대출 이율과 집값, 부동산 가격 예측 등의 주제를 다룹니다.
나도 하는 파이썬 데이터분석은 파이썬을 한번 배워볼까 하는 비전공자나 교육현장에서 데이터리터러시 관련 프로젝트를 진행하고 싶은 분들에게 적합한 책입니다. 이 책을 통해 파이썬의 기본적인 문법과 데이터 분석의 핵심 개념을 익히고, 실제 데이터를 다루는 능력을 키울 수 있습니다.
나도 하는 파이썬 데이터분석은 구글 콜랩이 주요 개발 환경입니다.
구글 콜랩은 구글이 제공하는 온라인 개발 플랫폼입니다. 구글 콜랩을 사용하면 웹 브라우저에서 파이썬 코드를 작성하고 실행할 수 있습니다. 구글 콜랩의 장점은 다음과 같습니다.
- 별도의 개발 환경을 설치할 필요가 없습니다. 인터넷 연결만 있으면 언제 어디서나 파이썬 코딩을 할 수 있습니다.
- 구글의 클라우드 서버를 이용하여 코드를 실행할 수 있습니다. 무료로 GPU와 TPU를 사용할 수 있어 머신러닝과 같은 고성능 연산을 할 수 있습니다.
- 구글 드라이브와 연동하여 데이터를 저장하고 불러올 수 있습니다. 또한 다양한 데이터 소스와 연결할 수 있습니다.
- 구글 콜랩은 Jupyter 노트북과 호환되며, 텍스트, 이미지, HTML, LaTeX 등을 함께 작성할 수 있습니다.
- 구글 콜랩은 구글 드라이브에 저장되며, 공유와 협업이 용이합니다. 다른 사람과 댓글을 달거나 실시간으로 코드를 수정할 수 있습니다.
구글 콜랩은 데이터 분석, 머신러닝, 인공지능 등의 분야에서 파이썬을 배우고 실습하고자 하는 학생, 취미가, 연구자들에게 유용한 도구입니다. 구글 콜랩을 사용하려면 다음 링크를 클릭하면 됩니다.
구글 코랩이라고도 합니다.
위와 같이 구글 콜랩을 실행하고 링크의 소스 코드와 실습데이터 링크를 통해서 자료를 받아 수행할 수 있습니다.
구글 콜랩에서 파일 업로드하는 코드입니다.
from google.colab import files
file_uploaded = files.upload()
이 코드를 실행하면 파일을 선택할 수 있는 버튼이 나타납니다. 원하는 파일을 선택하거나 드래그 앤 드롭하면 업로드가 완료됩니다. 업로드된 파일은 코랩의 작업 디렉토리에 저장됩니다.
이 방법은 로컬 드라이브에서 파일을 업로드하는 가장 간단한 방법입니다.
나도 하는 파이썬 데이터분석은 이처럼 매우 기초적인 부분도 상세히 다룹니다. 사실 비전공자는 이러한 것도 모릅니다.
다른 방법으로는 구글 드라이브를 코랩에 마운트하여 파일을 불러오는 방법이 있습니다. 이 방법은 구글 드라이브에 저장된 파일을 코랩에서 바로 사용할 수 있어 편리하지만, 인증 과정이 필요하고 세션이 만료되면 다시 인증해야 하는 단점이 있습니다. 그리고 나도 하는 파이썬 데이터분석에서는 이와 같은 복잡한 방법은 아예 배제함으로써 독자를 세심하게 배려하고 있습니다.
나도 하는 파이썬 데이터분석에서 다루는 folium 라이브러리는 파이썬에서 Leaflet.js를 이용하여 지도를 시각화하는 라이브러리입니다. Leaflet.js는 인터랙티브한 웹 지도를 만들 수 있는 자바스크립트 라이브러리입니다.
folium은 파이썬에서 데이터를 다루는 강점과 Leaflet.js에서 지도를 표현하는 강점을 결합한 라이브러리입니다.
folium을 사용하면 웹 브라우저에서 파이썬 코드로 지도를 작성하고 실행할 수 있습니다. folium은 다양한 타일셋을 제공하며, 구글 드라이브와 연동하여 데이터를 저장하고 불러올 수 있습니다.
folium은 코로플레스 맵, 마커, 선, 원, 이미지, 비디오, GeoJSON, TopoJSON 등의 오버레이를 지도에 추가할 수 있습니다.
folium은 데이터 분석, 머신러닝, 인공지능 등의 분야에서 지리적인 데이터를 시각화하고자 하는 사람들에게 유용한 도구입니다. 이처럼 저와 같은 비전공자들도 파이썬을 활용한 데이터 분석 시각화 프로젝트를 할 수 있도록 상세하게 라이브러리를 가르쳐주고 있습니다.
그리고 실제로 원소스 데이터를 어디서 구할 수 있는지까지 상세하게 알려주면서 소스 파일을 깃을 통해 함께 제공합니다. 이에 따라 독자가 쉽게 소스 데이터에 접근할 수 있으면서 추후에 다른 프로젝트로 다른 소스 파일을 구할 수 있는 방법까지도 자연스럽게 배우게 됩니다.
나도 하는 파이썬 데이터분석에서 인상 깊은 점은 다음과 같습니다.
그러면 나도 하는 파이썬 데이터분석에서 인상 깊은 점을 간략히 살펴보겠습니다.
이 옵션은 구글 콜랩에서만 사용하는 설정으로 파이참 등의 IDE(개발통합환경)에서는 사용 방법이 다르기 때문에 굳이 외울 필요는 없습니다.
이 부분에서 알 수 있듯이 비전공자의 부담을 낮춰주는 설명을 합니다.
사실 이 정도만 와도 비전공자는 엄청난 과부하가 걸릴 수 있습니다.
그런데 이런 표현 하나 문장 하나가 정말 큰 위안이 됩니다.
마치 파이썬을 하나도 모르는 비전공자들을 대상으로 교수님이 정말 하나씩 하나씩 설명해주는 그런 친절한 느낌을 나도 하는 파이썬 데이터분석에서 받았습니다.
NLP 자연어 분석은 비전공자들이 특히 관심이 있는 부분일 것입니다.
무언가 파이썬 인공지능 어렵지만 자연어 분석은 친근하게 느껴지기 때문입니다.
그러기에 나도 하는 파이썬 데이터분석에서는 이 부분도 놓치지 않습니다.
특히 워드클라우드는 비전공자나 일반 교과 교육현장에서도 교사와 학생들도 활용빈도가 높기 때문에 아주 중요하다고 할 수 있습니다.
나도 하는 파이썬 데이터분석에서 역시 위와 같이 다룹니다.
상관 분석도 역시 피어슨, 스피어먼, 켄달 상관 분석을 개괄하고 있습니다.
나도 하는 파이썬 데이터분석은 이와 같이 전공필수 기초 개론과목의 성격을 드러냅니다.
회귀분석 역시 나도 하는 파이썬 데이터분석은 어렵지 않게 핵심만 다루고 있습니다.
게다가 인공지능 ARIMA 분석을 통한 미래예측하는 프로젝트까지 나도 하는 파이썬 데이터분석에서는 다루고 있습니다.
정말 기초부터 기본까지 모두 실제 데이터를 통해 프로젝트를 진행하면서 누구나 스마트폰으로 모바일로 구글콜랩으로 쉽게 할 수 있습니다.
오늘은 나도 하는 파이썬 데이터분석 리뷰를 살펴보았습니다.
이상으로 나도 하는 파이썬 데이터분석에 대한 리뷰를 마치겠습니다.
인공지능 기술이 발전할수록 데이터리터러시의 중요성은 더욱 강조됩니다.
이 책은 파이썬과 데이터 분석에 입문하고자 하는 비전공자들을 위한 실전 지향적인 책입니다.
구글 콜랩을 활용하여 도시 생활 데이터를 수집하고 분석하는 다양한 예제를 통해 파이썬의 기본 문법과 데이터 분석의 핵심 개념을 익힐 수 있습니다. 인공지능 시대에 데이터리터러시는 필수적인 역량입니다. 나도 하는 파이썬 데이터분석은 이러한 역량을 키우는 데 도움이 되는 책이라고 생각합니다.
'책' 카테고리의 다른 글
직장인을 위한 챗GPT 리뷰 (1) | 2023.05.20 |
---|---|
조금 수상한 비타민C의 역사 리뷰 (0) | 2023.05.13 |
꼰대회사 배민? 이게 무슨 일이야 리뷰 (0) | 2023.04.17 |
세포부터 나일까? 언제부터 나일까? 리뷰 (0) | 2023.04.15 |
과학의 위로 리뷰 (1) | 2023.04.14 |
댓글