스터디

[아티클 스터디] 머신러닝이란?

DorYi 2024. 8. 13. 09:58

지난주부터 머신러닝 주차가 시작됐다.

그럼으로 이번 아티클은 '머신러닝'에 관한 아티클을 정리해보기로 했다.

아직은 어려운 개념이지만 공부할 수록 괜찮아질 거란 희망을 가져보며

오늘의 아티클 스터디 시작!


 

'머신러닝'이란?

컴퓨터 시스템이 데이터를 분석하고 그 데이터에서 패턴을 인식해 예측하거나 결정을 내리는 능력을 갖게 하는 인공지능 분야의 하나이다.

컴퓨터는 인간의 지시 없이 연산 능력을 사용하여 스스로 학습한다.

 

 

머신러닝의 종류

1. 지도학습

지도학습은 정답을 알려주고 학습하는 방법이다.

 

2. 비지도학습

정답을 알려주지 않고 데이터만으로 학습하는 방법이다.

데이터의 내제된 특징을 스스로 파악하는 것이 중요하다.

대표적인 방법으로 군집화가 있다.

 

3. 강화학습

일단 해보면서 경험을 통해 실력을 키워나가는 방법이다.

행동의 결과가 옳다면 상을, 틀리다면 벌을 받는 식으로 진행된다.

더 많은 보상을 받기위해 좋은 답을 찾아낸다는 것이 강화학습의 아이디어이다.

 

 

머신러닝의 강점

1. 아이디어와 혁신 : 일상 업무를 대신 처리해 설계자에게 새로운 아이디어를 탐구할 수 있게 한다.

2. 많은 기회 : 기존의 데이터를 모델로 만들어 디지털 수익원을 확보할 수 있다.

3. 심층적인 탐구 : 데이터의 깊이와 복잡함을 볼 수 있어 다양한 가능성을 탐구할 수 있다.

4. 강한 리더십

5. 많은 프로젝트 : 워크플로우를 개발하는데 도움을 줄 수 있고 이는 프로젝트(비즈니스) 성장에 기여할 수 있다.

6. 고객 만족 : 고객과 기업 간의 실시간 상호작용을 통해 고객의 니즈를 더욱 빠르게 예측, 충족시킬 수 있다.

 

 

머신러닝 파이프라인 (과정)

1. 데이터 불러오기 -> 2. EDA(탐색적 데이터 분석) -> 3. 전처리 -> 4. 모델학습 -> 5. 모델 성능 확인

 

 

'딥러닝'이란?

인공 신경망을 이용해 인공지능을 만드는 머신러닝의 한 분야이다.

딥러닝을 통해 표현학습, 자동화된 특징 추출, 이미지 및 비디오 처리, 패턴 인식, 연구 및 과학 등을 활용할 수 있다.

 

 

딥러닝의 종류

1. 인공신경망 : 간단한 분류 문제를 해결할 수 있다.

2. 합성곱 신경망 : 이미지와 같은 2D 데이터를 처리할 수 있다.

3. 순환 신경망 : 순차적인 데이터를 처리하는데 적합, 시간의 흐름에 따라 정보를 기억한다.

4. 생성적 적대 신경망 : 생성자와 판별자가 경쟁하며 학습한다.

5. 변환기 : 자연어 처리에 주 사용되며 단어의 중요도를 계산해 문맥을 이해한다.

 

 

머신러닝과 딥러닝의 차이점

  머신러닝 딥러닝
구조와 복잡성 비교적 단순한 모델 (ex. 선형회귀, 결정트리) 복잡한 구조 (다층 인공신경망 사용)
데이터 요구량 적은 양의 데이터로도 작동함 (특징 추출) 대량의 데이터 필요함 (정확한 예측)
하드웨어 자원 일반적인 CPU에서 잘 작동함 GPU, TPU 고성능 하드웨어 요구됨
자동 데이터 추출 직접 추출 자동 추출
성능과 유연성 문제에 맞는 알고리즘 선택 비정형 데이터에서 뛰어남,
문제의 복잡성과 양이 증가할수록 더 좋은 성능.

 

 


아직 나에겐 생소한 개념인 '머신러닝'

어디까지 쓰일지 아직 감도 안오지만

이미 우리 생활 전반에서 (내가 모르는 곳에도) 쓰이고 있다는게 어렴풋 느껴진다.