학습/머신러닝

머신러닝 찍먹하기

roquen4145 2024. 11. 8. 22:42

머신러닝

오늘은 머신러닝에 대해서 정리하는 포스팅을 적어보도록 하겠습니다.

최근 4주짜리 머신러닝 교육을 받았는데 거기서 배운 것들을 정리하는 형식이 되겠습니다.

머신러닝을 시작해보려고 하는 개발자나 우리 부서도 머신러닝을 도입해봐야 되지 않나 싶은 리더들이 참고하시면 좋겠습니다.

 

머신러닝 용어 정리

머신러닝 관련된 여러 가지 용어들이 있어서 헷갈리게 사용하는 경우가 있습니다.

머신러닝과 인공지능, 그리고 딥러닝이 그 주인공인데요.

세 가지 용어의 포함관계는 다음과 같습니다.

인공지능 > 머신러닝 > 딥러닝

 

인공지능은 규칙 기반으로 동작하는 것을 뜻하고

머신러닝은 데이터를 기반으로 동작하는 것을 뜻하며

딥러닝은 인공 신경망 기반으로 동작하는 것을 의미합니다.

 


머신러닝으로 할 수 있는 것

  • 머신러닝이라면 모든 것을 해줄 수 있을 거야, 머신러닝을 해보자!
  • XX님 머신러닝 하면 될 것 같은데 해주세요.

이런 생각을 갖고 있을 수도 있는데요.

머신러닝으로 해결할 수 있는 문제는 단 두 가지 입니다.

 

여러 가지의 데이터가 섞여있을 때 구분하는 것 (분류)

어떤 상황에서의 결과 값이 주어졌을 때 새로운 상황에 대한 결과 값을 예측하는 것(양적 예측)

 

이 두 경우를 제외하고 다른 것을 기대하셨다면 그것은 머신러닝이 아닌 다른 기술일 확률이 높습니다.

참고로 추천은 분류에 해당되고


머신러닝을 위한 전제조건

머신러닝은 데이터를 기반으로 동작하는 것이라는 말씀을 드렸습니다.

따라서 양질의 데이터를 확보하는 것이 머신러닝을 위한 전제조건입니다.

 

붓꽃 데이터

위의 그림은 머신러닝의 단골 데이터인 붓꽃 데이터입니다.

3가지 붓꽃 종류에 대해 각 꽃의 꽃받침 길이, 꽃받침 너비, 꽃잎의 길이, 꽃잎의 너비 정보가 저장되어 있습니다.

꽃받침과 꽃잎 정보로 꽃을 구분할 수 있기 때문에 데이터가 충분한 상황입니다.

 

하지만 붉은 장미와 하얀 장미를 구분할 때는 꽃받침과 꽃잎의 정보만으로 가능할까요?

불가능할 것입니다.

 

머신러닝을 위해 데이터가 충분한 지 판단하기가 쉽지 않은데요.

처음 접근할 때에는 가능한 모든 정보를 수집한 후 정제하는 것이 좋습니다.

'아 이건 나도 할 수 있겠다'라고 생각이 드는 것부터 머신러닝을 도입하는 것이 좋을 것 같네요.


머신러닝 방법

그래서 어떻게 머신러닝을 하냐고 물으실 수 있습니다.

머신러닝은 크게 위의 예시처럼 붓꽃 종류 같이 정답 정보가 주어진 채로 수행하는 지도 학습과

데이터만 존재하는 비지도 학습이 있습니다.

그리고 지도 학습에 속하지만 세부 분류로 시계열 분석과 앙상블 학습 등이 있습니다.

자세한 방법은 후속 포스팅에서 설명하도록 하겠습니다.

반응형

'학습 > 머신러닝' 카테고리의 다른 글

머신러닝 공부를 위한 링크 모음  (2) 2017.08.08
[머신러닝] TensorFlow 설치  (0) 2017.07.18