랜덤 포레스트2 9번째 인공지능 - 배깅(Bagging), 배깅피쳐(Bagging Feature) 배깅(Bagging), 배깅피쳐(Bagging Feature) ● 500개의 행이 있는 학습 데이터 셋이 있다고 가정해봅시다. 이 중 임의로 50개씩 행을 선택해서 하나의 의사결정트리를 만드는 게 '와꾸''틀'의 골자입니다. ● 이 틀는'배깅(Bagging)'이라고 불립니다. ● 이런 식으로 트리를 만들면 모든 트리들이 다 다를 거라는 것을 추정해볼 수 있습니다. 아하! 정리하면 배경은 학습 데이터의 일부를 각각 다르게 학습시켜 서로 다른 의사결정 트리를 만드는 기법이로군요! ● 배깅의 목적은? 트리의 다양성을 확보하는 데 있습니다. ● 근데 배깅에서 잊지 말아야 할 것이 있습니다. 바로 '중복'을 허용한다는 점이죠. ● 500개의 행이 있는 가방(bag)에서 임의로 50개 뽑아 첫 번째 트리를 만들고 .. 2022. 8. 16. 8번째 인공지능 - 의사결정트리 의사결정 트리 ● 의사결정 트리는 직관적으로 이해하기 쉽고, 분류 및 예측 결과에 대한 이유나 설명이 필요한 경우에 많이 사용합니다. - 예를 들어, 환자가 어떤 병에 걸렸을 때 이러이러한 조건에 부합하기 때문에 어떠한 질병이 의심된다고 설명을 해줄 수 있는 것이죠. 즉 판단에 대한 나름의 설명력이 좋습니다. ● 하지만 정확도를 높이기 위해서 불순도가 낮은 상태를 향해 달려가다 보면 질문이 많아지고, 트리의 깊이가 그만큼 깊어지게 됩니다. 이렇게 되면 과대 적합(오버 피팅)됩니다.(오버 피팅)됩니다. 즉, 학습을 했음에도 되려 성능이 떨어지게 됩니다. - 이럴 땐 어떻게 해야 할까요? 조경을 할 때 중요한 작업이 있습니다. 바로 가지치기입니다 - 사람 관계에도 가지치기가 필요합니다. 정리가 필요한 관계는.. 2022. 8. 16. 이전 1 다음