Data Science/Code States - AI Bootcamp
-
Review : Section 2Data Science/Code States - AI Bootcamp 2021. 3. 2. 23:58
두 번째 Section review Section 2 : Machine Learning - 오즈 -> 비선형 함수를 직관적으로 해석하기 쉽게 해줌, odds = 3 은 성공확률이 실패확률의 3배라는 의미 - 로짓변환 : 오즈에 로그 취해 변환하는 것, 비선형형태인 로지스틱 함수를 선형형태로 만들어서 해석이 쉽도록 해줌, 특성이 증가하면 로짓이 얼마나 증감하는지 해석할 수 있음 - R-squared : 분산을 기반으로 하며 1에 가까울수록 성능이 좋음, 예측값 variance/ 실제값 variance - 추가로 인코딩 방법에 대해서 알아보기 - 강의 노트에서 자세히 다루지 않은 부스팅 모델에 대해서 더 알아보기
-
Review : Section 1Data Science/Code States - AI Bootcamp 2021. 1. 27. 16:08
Section을 마무리하면서 정리해보는 글 키워드를 정리해보면서 더 연습을 해보면 좋겠다 하는 부분과 대충 넘겨 잘 모르는 부분을 표시해주었다 1. Data Preprocess & EDA - 데이터 시각화에서 annotation 연습해보기 2. Statistics - T-test의 조건 : 독립성, 등분산성, 정규성 데이터 정규성 확인 from scipy.stats import normaltest normaltest(data) - Non parametric methods (비모수 통계) 모집단이 특정 확률 분포를 따른다는 전제를 하지 않는 방식, 모수에 대한 가정을 전제로 하지 않고 모집단의 형태에 관계 없이 데이터의 확률 계산해 검정하는 분석법. chisquare, kruskal-wallis test...