안녕하세요, 데이터 탐험가님! 당신의 임무는 광활한 우주에서 수집된 오염된 데이터를 정제하여 새로운 지식 행성을 발견하는 것입니다.
수집된 데이터에는 측정 오류나 누락된 값이 많아 그대로 분석하면 잘못된 결론에 도달할 수 있습니다. 이것이 바로 우리가 전처리를 배워야 하는 이유입니다!
데이터 전처리 과정에서 우리가 찾아야 할 두 가지 주요 '적'이 있습니다.
(Missing Value)
측정되지 않아 비어있는 값입니다. 불완전한 행은 보통 삭제하여 처리합니다.
(Outlier)
너무 크거나 작아서 상식적으로 이해하기 힘든 튀는 값입니다. 오류라면 수정이 필요합니다.
이제 이들을 처리할 도구인 CODAP 사용법을 알아봅시다.
CODAP의 각 아이콘을 클릭하여 상세 기능을 확인하세요. 모든 기능을 확인해야 미션으로 이동할 수 있습니다.
위의 아이콘을 클릭하면 상세 설명이 여기에 나타납니다.
아래 표에서 문제를 해결하세요!
1. 빨간색(결측치)을 클릭하여 **데이터 행을 삭제**하세요.
2. 보라색(이상치)을 클릭하여 **정상 범위로 수정**하세요.
| 탐사 ID | 행성 구역 | 온도 (℃) | 중력 (g) |
|---|
탐험가님, 오염된 데이터를 성공적으로 정제하셨습니다!