티스토리 뷰

모두를 위한 데이터 사이언스 > 파이썬 문자열 : 부스트코스 (boostcourse.org)

 

모두를 위한 데이터 사이언스

부스트코스 무료 강의

www.boostcourse.org

무료강의. 듣고 정리해보기로 한다!

 

 

1. 데이터 사이언스란 무엇인가
콘웨이의 데이터 사이언스 벤다이어그램

1). 해킹 스킬(프로그램)
2). 수학적, 통계적 지식
3). 전문적인 도메인 지식

3개가 융합한 것 = 데이터 사이언스

쿼라 사이트(질문 올리고 답 얻는 사이트)
딥러닝 분야에서 전통적인 통계가 다시 중요해질까?
-사이언스는 전쟁이 아니고 협업이다.

정형데이터(숫자 등)/비정형데이터(소리, 사진, 그림 등)
여기에서 지식과 인사이트를 추출하는 과학적 방법론을 알아본다. 

 

::비정형데이터라는 말을 처음 들어봐서 신기했다.
소리, 사진, 그림 등도 데이터로군.


데이터를 수집, 전처리, 깨끗하게 하고, 탐색하고, 모델과 알고리즘 만들고, 시각화 하고, 의사결정에 반영.
데이터 분석; 정리, 변환, 모델링 과정. 의사결정을 지원한다. 

 

:: 의사결정에 도움이 되는 것이 데이터 분석


탐색적 데이터 분석(존 튜키)
박스플롯. 부족한 정보를 가지고 탐색함. 

정보 디자인


나폴레옹의 모스크바 진군 과정을 표현한 다이어그램. 1861년 작. 초기 인포메이션 그래픽의 예.
존 스노의 콜레라 지도. 사망자의 수 시각화. 사망자 근처에 펌프가 있어. ->콜레라가 물을 통해서 전파하는 것을 밝혀냄.
나이팅게일과 로즈다이어그램. 부상이 아니라 치료나 병원 상태 때문에 사망한 것을 알아냄. 

 

::데이터를 시각화하면 정보를 드러내고 강력하게 설득할 수 있다


코로나 백신 백신접종 현황
인공지능 vS 머신러닝 VS 딥러닝
스팸메일 구분 등

데이터가 필요
가비지인 가비지아웃. 어떻게 넣느냐에 따라 결과가 달라짐
:: 일단 데이터가 필요하겠군.

 

<신호와 소음>강사님이 좋아하는 책. 더퀘스트

 

 

댓글