에이전트 X 자원 다운로드 중...
우주선 통신 연결 대기 중 (0%)
에이전트 X
잃어버린 코어 (Lost Core)
탐사선 노아호의 조난
평화로운 우주 항해를 이어가던 우주 탐사선 노아호.
신입 우주 비행사 한결과 그의 파트너 AI 로봇 에이전트 X는 유용한 데이터를 찾기 위해 끝없는 우주를 탐사하고 있었습니다.
하지만 항해 도중, 정체불명의 거대 우주 폭풍과 중력장에 휘말리고 맙니다!
기체는 심하게 요동쳤고 장비들은 파손되었으며, 결국 노아호는 이름 모를 외딴 행성에 불시착하게 됩니다.
"경고! 시스템 오류. 충돌의 여파로 에이전트 X의 학습 데이터가 모두 유실되었습니다..."
영상을 확인한 후, 우주선 밖으로 나가 외계인을 피해 다니며 에이전트 X의 학습에 필요한 '버섯(식용 및 독버섯)' 데이터를 직접 수집해 주세요!
강화학습: 탈출의 길을 찾아라
보상 규칙을 설정하고 에이전트 X가 최적 경로를 찾도록 도와주세요!
강화학습(Reinforcement Learning)이란?
AI가 시행착오를 통해 스스로 학습하는 방식입니다.
좋은 행동에는 보상(+)을, 나쁜 행동에는 벌(-)을 줘서,
점점 더 좋은 행동을 선택하도록 학습합니다. 게임 AI가 대표적인 예시입니다!
에이전트 X
마스터, 이 미로의 지도가 없습니다. 보상 규칙을 알려주시면, 시행착오를 통해 탈출구를 찾아보겠습니다!
보상(Reward) 규칙 설정
학습 진행 상황
0
에피소드
0%
성공률
-
최단 경로
미션 완료!
한결과 에이전트 X가 무사히 우주로 탈출했습니다!


"마스터, 정답을 알려주시는 지도학습,
스스로 규칙을 찾는 비지도학습,
그리고 시행착오로 배우는 강화학습 덕분에
제가 한 단계 더 진화했습니다!"
"맞아! 네가 배운 지도학습은 이메일 스팸 필터에, 비지도학습은 유튜브 추천 알고리즘에, 그리고 강화학습은 자율주행 자동차에 쓰이는 진짜 인공지능 기술들이야."
"고마워, 에이전트 X. 우린 이제 최고의 팀이야!"
지도학습
정답(레이블)으로 학습
비지도학습
특징으로 패턴 발견
강화학습
보상으로 최적 행동 학습