2025. 1. 6. 11:06ㆍLLM(Large Language Model)의 기초/머신러닝과 딥러닝
1. 인공지능
* 인공지능(AI, Artificial Intelligence)은 컴퓨터나 기계가 인간처럼 생각하고 학습하며 문제를 해결하는 능력을 갖추도록 만드는 기술입니다.
* AI는 컴퓨터 과학의 한 분야로, 데이터를 활용해 의사결정을 내리거나 예측하는 시스템을 개발하는 것을 목표로 합니다.
1-1. 규칙 기반 알고리즘
* Rule-based algorithms(규칙 기반 알고리즘)은 명시적으로 정의된 규칙(If-Then-Else 문법 등)을 사용하여 특정 문제를 해결하거나 작업을 수행하는 알고리즘입니다.
* 이러한 알고리즘은 사람이 직접 작성한 논리와 조건에 따라 작동하며, 데이터를 학습하지 않고도 결과를 도출할 수 있습니다.
1-2. 머신러닝
* 머신러닝(Machine Learning)은 인공지능(AI)의 한 분야로, 컴퓨터가 명시적으로 프로그래밍되지 않아도 데이터에서 패턴을 학습하고, 이를 기반으로 새로운 데이터를 예측하거나 결정을 내리는 기술입니다.
* 머신러닝은 AI의 핵심 기술로, 우리가 사용하는 많은 기술과 서비스의 기초가 됩니다.
1-3. 딥러닝
* 딥러닝(Deep Learning)은 머신러닝의 한 분야로, 사람의 뇌에서 영감을 받은 인공신경망(Artificial Neural Networks)을 사용하여 데이터를 학습하고 복잡한 문제를 해결하는 기술입니다.
* 특히, 딥러닝은 대량의 데이터와 고성능 컴퓨팅 자원을 활용하여 뛰어난 성능을 발휘하며, 이미지, 음성, 자연어 처리 등에서 주로 사용됩니다.
2. 머신러닝으로 할수 있는 것
2-1. 분류(Classification)
- 데이터를 카테고리로 분류하는 작업입니다.
- 예) 이메일 스팸 분류 (스팸 vs 비스팸)
2-2. 회귀(Regression)
- 숫자 예측 문제를 해결합니다.
- 예) 주택 가격 예측
2-3. 클러스터링(Clustering)
- 데이터를 비슷한 특성을 가진 그룹으로 나눕니다.
- 예) 고객 세그먼트 분석
2-4. 추천 시스템((Recommendation System)
- 사용자의 선호도를 기반으로 맞춤형 추천을 제공합니다.
- 예) 넷플릭스 영화 추천
2-5. 이상 탐지(Anomaly Detection)
- 정상 데이터에서 벗어난 이상치를 탐지합니다.
- 예) 금융 사기 탐지
2-6. 강화학습(Reinforcement Learning)
- 에이전트가 환경과 상호작용하며 최적의 행동을 학습합니다.
- 예) 자율주행 자동차
3. 머신러닝의 학습 방법
3-1. 지도학습(Supervised Learning)
- 입력 데이터와 해당 데이터의 정답(레이블)이 제공되는 학습 방식입니다.
- 주어진 입력에 대해 올바른 출력(레이블)을 예측하는 모델을 학습합니다.
3-2. 비지도 학습(Unsupervised Learning)
- 입력 데이터에는 레이블(정답)이 없으며, 데이터 자체의 구조나 패턴을 학습합니다.
- 데이터 내에서 숨겨진 구조를 찾거나 그룹화를 수행합니다.
3-3. 클러스터링(Clustering)
- 데이터를 비슷한 그룹으로 묶습니다.
- 데이터를 더 작은 차원으로 변환하여 시각화하거나 연산 효율성을 높입니다
3-4. 강화학습(Reinforcement Learning)
- 에이전트(Agent)가 환경(Environment)과 상호작용하며 보상(Reward)을 최대화하는 행동을 학습합니다.
3-5.반지도학습(Semi-Supervised Learning)
- 데이터의 일부에만 레이블이 있고, 나머지는 레이블이 없는 상태에서 학습합니다.
- 레이블링된 데이터가 적을 때 유용합니다.
3-6. 자기 지도 학습(Self-Supervised Learning)
- 데이터에서 레이블 없이 일부 정보를 예측하도록 학습합니다.
- 데이터를 활용하여 자체적으로 레이블 생성합니다.
3-7. 온라인 학습(Online Learning)
- 데이터를 순차적으로 제공하며, 실시간으로 학습하는 방식힙니다.
- 데이터가 점진적으로 들어오는 환경에 적합합니다.
3-8. 트랜스퍼 러닝(Transfer Learning)
- 사전 학습된 모델의 지식을 새로운 문제에 적용합니다.
- 학습 시간이 단축되며, 적은 데이터로 성능 향상을 할 수 있습니다.
> 모델
* AI에서 "모델"은 주어진 데이터를 학습하여 패턴과 규칙을 찾아내고, 새로운 데이터에 대해 예측이나 결정을 내리는 수학적 구조 또는 알고리즘입니다.
* 예를 들어, 사진 속 동물이 강아지인지 고양이인지 구분하거나, 다음에 올 단어를 예측하는 것이 AI 모델의 역할입니다.
* 모델은 주로 데이터와 수학적 함수의 조합으로 구성되며, 학습(Training) 과정을 통해 최적의 매개변수(Weights, Biases)를 찾아갑니다.
* 즉, 모델은 데이터를 보고 문제를 해결하는 AI의 "두뇌" 역할을 합니다.
> 학습
* AI에서 "학습"은 주어진 데이터로부터 패턴과 규칙을 찾아내어, 모델의 매개변수(가중치, 편향 등)를 최적화하는 과정입니다.
* 이 과정에서 모델은 입력 데이터와 정답(레이블)을 비교하여 오류(오차)를 계산하고, 이를 최소화하기 위해 역전파(Backpropagation)와 최적화 알고리즘을 사용해 매개변수를 반복적으로 조정합니다.
* 즉, 학습은 모델이 더 정확한 예측이나 결정을 내릴 수 있도록 스스로 개선하는 과정입니다.
'LLM(Large Language Model)의 기초 > 머신러닝과 딥러닝' 카테고리의 다른 글
6. 서울 자전거 공유 수요 예측 데이터셋 (0) | 2025.01.08 |
---|---|
5. 주택 임대료 예측 데이터셋 (0) | 2025.01.07 |
4. 사이킷런 (0) | 2025.01.07 |
3. 파이토치로 구현한 선형 회귀 (2) | 2025.01.06 |
2. 파이토치 프레임워크(인공지능/데이터분석) (2) | 2025.01.06 |