본문 바로가기

데이터 가공2

Python을 이용한 결측치 대체하기(2) 2022.08.01 - [데이터 가공] - Python을 이용한 결측치 대체하기(1) 이전 글에 이어서 작성해보도록 하겠습니다. 5) 결측치를 회귀모형 추정값으로 대체하기 방법을 먼저 말씀드리자면! 결측값을 제외한 데이터를 이용하여 선형회귀모형 훈련을 시키고, 추정값을 계산하여 결측치를 추정값으로 대체하는 방법입니다. 데이터프레임은 지난시간에 사용했던 데이터를 그대로 이용해보겠습니다. 데이터가 너무 단순해서 선형회귀모형 훈련을 시키기 민망하지만, 한눈에 쉽게 알아보기위해서 그대로 사용하겠습니다. 코드는 동일하게 적용하시면 됩니다. 먼저, 선형회귀 모델을 불러와주고 이를 l_reg이라는 변수에 넣어주도록 하겠습니다. 이전 게시글에서 불러왔던 pandas와 Series, DataFrame도 다시한번 불러와주.. 2022. 8. 2.
Python을 이용한 결측치 대체하기(1) 결측치란? 쉽게 말하면 값이 없는 것으로 NaN값을 흔히 결측치라고 합니다. 결측치가 존재하는 DataFrame을 한번 만들어보겠습니다. 혹시나 직접 따라해보고싶으신 분들 계실까하여, 데이터프레임 만든 코드도 공유해드리도록 하겠습니다. 만드는 방법은 여러가지가 있지만, 저는 딕셔너리가 편할 것 같아서 이렇게 만들었습니다. a = [] a.append({'이름':'짱구', '국어':50, '영어':70, '수학':30, '역사':90, '과학':40}) a.append({'이름':'철수', '국어':100, '영어':95, '수학':80, '역사':80}) a.append({'이름':'유리', '국어':90, '영어':90, '수학':70, '역사':90, '과학':80}) a.append({'이름':'훈.. 2022. 8. 1.