LV. 1 탐험가

🛸 데이터 우주로의 초대

안녕하세요, 데이터 탐험가님! 당신의 임무는 광활한 우주에서 수집된 오염된 데이터를 정제하여 새로운 지식 행성을 발견하는 것입니다.

수집된 데이터에는 측정 오류나 누락된 값이 많아 그대로 분석하면 잘못된 결론에 도달할 수 있습니다. 이것이 바로 우리가 전처리를 배워야 하는 이유입니다!

🧬 무엇을 정제해야 할까요?

데이터 전처리 과정에서 우리가 찾아야 할 두 가지 주요 '적'이 있습니다.

1. 결측치

(Missing Value)
측정되지 않아 비어있는 값입니다. 불완전한 행은 보통 삭제하여 처리합니다.

2. 이상치

(Outlier)
너무 크거나 작아서 상식적으로 이해하기 힘든 튀는 값입니다. 오류라면 수정이 필요합니다.

이제 이들을 처리할 도구인 CODAP 사용법을 알아봅시다.

🛠 CODAP 탐사 장비 가이드

CODAP의 각 아이콘을 클릭하여 상세 기능을 확인하세요. 모든 기능을 확인해야 미션으로 이동할 수 있습니다.

📊

데이터 테이블

📈

그래프 생성

🔍

데이터 필터

🧮

수식 계산

위의 아이콘을 클릭하면 상세 설명이 여기에 나타납니다.

확인한 장비: 0 / 4

🎯 미션: 오염된 행성 데이터 정화

아래 표에서 문제를 해결하세요!
1. 빨간색(결측치)을 클릭하여 **데이터 행을 삭제**하세요.
2. 보라색(이상치)을 클릭하여 **정상 범위로 수정**하세요.

탐사 ID 행성 구역 온도 (℃) 중력 (g)
💎

미션 성공!

탐험가님, 오염된 데이터를 성공적으로 정제하셨습니다!

오늘의 탐험 일지

  • 전처리는 분석 전 데이터를 깨끗하게 만드는 과정이다.
  • 값이 비어있는 결측치는 신뢰도가 낮으므로 해당 행을 삭제하기도 한다.
  • 튀는 값인 이상치는 오류인지 확인 후 정상 값으로 정정한다.
  • CODAP을 활용하면 이를 시각적으로 쉽게 할 수 있다.