728x90
반응형
ChatGPT를 이용하여 코딩 공부를 해보려 한다.
100일 동안 공부하고 기록할 것이다.
많이 읽어주시고 항상 감사하다. (훈수는 항상 환영한다.)
Day 36: 데이터 전처리
- 결측치 처리와 중복 제거.
- 실습: 누락된 데이터를 처리하고 정리된 데이터 출력.
결측치(누락된 데이터) 처리
데이터를 수집하다 보면 누락된 값(NaN, None, 빈 문자열) 이 존재할 수 있음.
Python의 Pandas 라이브러리를 사용하면 쉽게 결측치를 처리할 수 있음.
✅ 결측치 확인하기

✅ 결측치 처리 방법
- 결측치 제거 (dropna())
- 데이터에서 NaN이 포함된 행을 삭제.

2.결측치 채우기 (fillna())
- 평균값, 특정 값으로 채우기 가능

중복 데이터 제거
데이터가 중복으로 수집될 수도 있으므로 중복 행을 제거해야 합니다.
✅ 중복 확인 및 제거

실습: 코인 가격 데이터에서 결측치 처리 및 중복 제거

이렇게 프로그램을 만들었고

파일을 찾았다.
결과는 어제와 크게 다른 것 없다.
오늘은 이만
읽어주셔서 감사하다.
반응형
'코딩 100일 도전' 카테고리의 다른 글
| 취미로 코딩 공부하기 38일차 (0) | 2025.02.12 |
|---|---|
| 취미로 코딩 공부하기 37일차 (0) | 2025.02.11 |
| 취미로 코딩 공부하기 35일차 (1) | 2025.02.09 |
| 취미로 코딩 공부하기 34일차 (1) | 2025.02.08 |
| 취미로 코딩 공부하기 33일차 (1) | 2025.02.07 |