728x90
반응형

 

ChatGPT를 이용하여 코딩 공부를 해보려 한다. 

100일 동안 공부하고 기록할 것이다. 

많이 읽어주시고 항상 감사하다. (훈수는 항상 환영한다.)

 

Day 36: 데이터 전처리

  • 결측치 처리와 중복 제거.
  • 실습: 누락된 데이터를 처리하고 정리된 데이터 출력.

결측치(누락된 데이터) 처리

데이터를 수집하다 보면 누락된 값(NaN, None, 빈 문자열) 이 존재할 수 있음.
Python의 Pandas 라이브러리를 사용하면 쉽게 결측치를 처리할 수 있음.

결측치 확인하기

 

결측치 처리 방법

  1. 결측치 제거 (dropna())
    • 데이터에서 NaN이 포함된 행을 삭제.
     

 

2.결측치 채우기 (fillna())

  • 평균값, 특정 값으로 채우기 가능

 

중복 데이터 제거

데이터가 중복으로 수집될 수도 있으므로 중복 행을 제거해야 합니다.

중복 확인 및 제거

 

실습: 코인 가격 데이터에서 결측치 처리 및 중복 제거

 

이렇게 프로그램을 만들었고

파일을 찾았다.

결과는 어제와 크게 다른 것 없다.

 

오늘은 이만 

 

읽어주셔서 감사하다.

반응형

+ Recent posts