2025/01 20

2. IMDB Dataset를 활용한 데이터 전처리

1. IMDB Dataset* IMDB Dataset of 50K Movie Reviews는 영화 리뷰 50,000개로 구성된 대규모 텍스트 데이터셋으로, 리뷰의 감정(긍정적 또는 부정적)이 라벨링되어 있어 감정 분석(Sentiment Analysis) 연구 및 모델 학습에 자주 사용됩니다. * 이 데이터셋은 25,000개의 학습 데이터와 25,000개의 테스트 데이터로 균등하게 나뉘어 있으며, 각 리뷰는 영어로 작성되어 있습니다.* 리뷰는 텍스트 길이가 다양하며, 자연어 처리(NLP) 알고리즘의 성능 평가 및 감정 분석 기술 향상을 위한 표준 데이터셋으로 널리 활용됩니다.  * 링크 주소 : https://www.kaggle.com/datasets/lakshmi25npathi/imdb-dataset-o..

1. 자연어 처리

1. 자연어* 자연어는 인간이 일상적으로 의사소통에 사용하는 언어로, 말과 글을 통해 표현되는 언어를 말합니다.* 자연어는 문법, 어휘, 맥락, 뉘앙스 등 복잡한 요소들로 이루어져 있어 규칙적인 구조와 함께 다양한 변형이 가능합니다.* 컴퓨터 과학에서는 이러한 자연어를 이해하고 처리하기 위해 자연어 처리(NLP, Natural Language Processing) 기술이 사용되며, 이를 통해 텍스트 분석, 번역, 음성 인식, 챗봇과 같은 다양한 응용이 가능합니다.* 자연어는 인간의 사고와 문화적 배경을 반영하므로, 이를 다루는 기술은 인문학적 이해와 기술적 접근이 결합되어야 합니다. 2. 자연어 처리* 자연어 처리는(Natural Language Processing, NLP) 컴퓨터가 인간의 언어를 이해..

ResNet 논문

Abstract # 더 깊은 신경망은 학습이 어렵다는 문제를 해결하기 위해 잔차 학습(residual learning) 프레임워크를 제안 Deeper neural networks are more difficult to train. --> 더 깊은 신경망은 학습이 더 어렵다는 문제가 있습니다. We present a residual learning framework to ease the training of networks that are substantially deeper than those used previously. ----> 우리는 이전보다 훨씬 깊은 네트워크를 학습하기 쉽게 만들기 위해 잔차 학습(residual learning) 프레임워크를 제안합니다. # 레이어를 입력에 대한 참조를 ..

카테고리 없음 2025.01.23

6. Alien vs. Predator 데이터셋

6. Alien vs. Predator 데이터셋* Alien vs Predator 데이터셋은 컴퓨터 비전과 이미지 분류 모델을 학습시키기 위해 제공되는 소규모 데이터셋입니다. * 이 데이터셋은 영화 속 캐릭터인 에일리언(Alien)과 프레데터(Predator)의 이미지로 구성되어 있습니다. * 이 데이터를 통해 이 두 클래스를 분류하는 이미지 분류 모델을 학습시킬 수 있습니다.링크 주소 : https://www.kaggle.com/datasets/pmigdal/alien-vs-predator-images Alien vs. Predator imagesSmall image classification - for transfer learningwww.kaggle.com 예시 1)#폴더 다운로드!kaggle da..

5. 손글씨 도형 분류 FastAPI로 서빙

1.손글씨 도형 분류하기 shape_classifier.py 로 저장한다. 예시 1)import torchimport torch.nn as nnimport torch.optim as optimimport torchvisionimport torchvision.transforms as transformsfrom torch.utils.data import Dataset, DataLoader# 데이터 전처리를 위한 transform 정의transform = transforms.Compose([ transforms.Resize((28, 28)), # 이미지 크기를 28x28로 조정 transforms.Grayscale(1), # 이미지를 그레이스케일로 변환 (채널 1개) transform..

4. Alexnet 구현하기

1. Alexnet* AlexNet은 2012년 ILSVRC(ImageNet Large Scale Visual Recognition Challenge)에서 우승한 딥러닝 모델로, 딥러닝의 대중화를 이끈 중요한 합성곱 신경망(CNN)입니다. * 이 모델은 8개의 레이어(5개의 합성곱 레이어와 3개의 완전 연결 레이어)로 구성되어 있으며, ReLU 활성화 함수, 드롭아웃(dropout), 데이터 증강(data augmentation) 등을 사용해 과적합을 방지하고 학습 성능을 향상시켰습니다. * AlexNet은 대규모 데이터셋과 GPU 병렬 연산을 활용해 1,000개의 클래스 분류 문제에서 top-1, top-5 error rates가 각각 37.5%, 17.5%로 뛰어난 성능을 보여, 컴퓨터 비전에서 딥러..

4. 손글씨 도형 분류하기

1. 손글씨 도형  예시 1)# %cd 명령어는 현재 작업 중인 디렉토리를 변경할 때 사용됩니다.%cd /content/drive/MyDrive/KDT 시즌 4/11. 딥러닝/data 예시 2)# zip 파일을 압축 해제하는 명령어# !unzip은 zip 파일을 풀 때 사용하는 명령어입니다.# -qq 옵션은 "quick"의 약자로, 압축 해제 중 상태 메시지를 출력하지 않도록 설정합니다.# 압축이 풀리면 현재 디렉토리 또는 zip 파일이 포함된 디렉토리에 파일이 생성됩니다.!unzip -qq "/content/drive/MyDrive/KDT 시즌 4/11. 딥러닝/data/shape.zip" 예시 3)import torchimport torch.nn as nnimport to..

3. CNN(Convolutional Neural Network, 합성곱 신경망)

1.CNN* CNN(Convolutional Neural Network, 합성곱 신경망)은 주로 이미지나 비정형 데이터의 패턴을 학습하고 분석하는 데 사용되는 딥러닝 모델입니다. * CNN은 이미지의 공간적 구조를 효율적으로 처리하기 위해 합성곱 계층(convolutional layer)을 사용하며, 이 계층은 필터(커널)를 통해 입력 데이터에서 중요한 특징(에지, 모양 등)을 추출합니다. * 이어서 풀링 계층(pooling layer)을 통해 차원을 축소하고 계산 효율을 높이며, 마지막으로 완전 연결 계층(fully connected layer)을 사용해 특정 클래스나 값을 예측합니다. * CNN은 이미지 분류, 객체 탐지, 영상 처리 등 다양한 분야에서 높은 성능을 발휘하며, 이미지의 공간적 관계를 ..

2. Multi-class Weather Dataset

##**1.Multi-class Weather Dataset*** Multi-class Weather Dataset은 다양한 기상 조건을 포함하는 이미지 데이터셋으로, 주로 기계 학습 및 딥러닝 모델을 학습하거나 평가하는 데 사용됩니다. * 이 데이터셋은 맑음, 비, 눈, 흐림과 같은 여러 날씨 유형으로 라벨이 지정된 다중 클래스 분류 문제를 다룹니다. * 각 클래스는 다양한 시간대, 계절, 지역에서 촬영된 이미지를 포함하여 현실 세계의 다양성을 반영하도록 설계되었습니다. * 이를 통해 모델은 날씨 조건을 정확히 분류하고, 기상 관측, 자동화된 날씨 보고, 혹은 자율주행 차량의 환경 인식 시스템과 같은 다양한 응용 분야에서 활용될 수 있습니다.링크 주소 : https://www.kaggle.com/dat..

1. 딥러닝: 퍼셉트론과 다층 퍼셉트론

1.생물학적 뉴런* 생물학적 뉴런은 신경계를 구성하는 기본 단위로, 정보를 수집, 처리, 전달하는 기능을 담당합니다. * 뉴런은 크게 세 가지 주요 부분으로 나뉩니다: 수상돌기(dendrite), 세포체(cell body), 축삭(axon)입니다. * 수상돌기는 다른 뉴런이나 외부 자극으로부터 신호를 받아들이는 역할을 하며, 세포체는 이 신호를 처리하고 통합합니다. * 처리된 신호는 축삭을 통해 다음 뉴런이나 근육, 혹은 샘과 같은 다른 조직으로 전달됩니다. * 축삭의 끝에는 시냅스(synapse)가 있어 화학적 신호 또는 전기적 신호를 통해 다른 세포와 연결됩니다. * 뉴런은 이러한 작용을 통해 신경계가 복잡한 정보를 효율적으로 처리하고 전달할 수 있도록 돕습니다. 2. 인공 신경망* 인공 신경망(Ar..