전체 글 177

3. CNN(Convolutional Neural Network, 합성곱 신경망)

1.CNN* CNN(Convolutional Neural Network, 합성곱 신경망)은 주로 이미지나 비정형 데이터의 패턴을 학습하고 분석하는 데 사용되는 딥러닝 모델입니다. * CNN은 이미지의 공간적 구조를 효율적으로 처리하기 위해 합성곱 계층(convolutional layer)을 사용하며, 이 계층은 필터(커널)를 통해 입력 데이터에서 중요한 특징(에지, 모양 등)을 추출합니다. * 이어서 풀링 계층(pooling layer)을 통해 차원을 축소하고 계산 효율을 높이며, 마지막으로 완전 연결 계층(fully connected layer)을 사용해 특정 클래스나 값을 예측합니다. * CNN은 이미지 분류, 객체 탐지, 영상 처리 등 다양한 분야에서 높은 성능을 발휘하며, 이미지의 공간적 관계를 ..

2. Multi-class Weather Dataset

##**1.Multi-class Weather Dataset*** Multi-class Weather Dataset은 다양한 기상 조건을 포함하는 이미지 데이터셋으로, 주로 기계 학습 및 딥러닝 모델을 학습하거나 평가하는 데 사용됩니다. * 이 데이터셋은 맑음, 비, 눈, 흐림과 같은 여러 날씨 유형으로 라벨이 지정된 다중 클래스 분류 문제를 다룹니다. * 각 클래스는 다양한 시간대, 계절, 지역에서 촬영된 이미지를 포함하여 현실 세계의 다양성을 반영하도록 설계되었습니다. * 이를 통해 모델은 날씨 조건을 정확히 분류하고, 기상 관측, 자동화된 날씨 보고, 혹은 자율주행 차량의 환경 인식 시스템과 같은 다양한 응용 분야에서 활용될 수 있습니다.링크 주소 : https://www.kaggle.com/dat..

1. 딥러닝: 퍼셉트론과 다층 퍼셉트론

1.생물학적 뉴런* 생물학적 뉴런은 신경계를 구성하는 기본 단위로, 정보를 수집, 처리, 전달하는 기능을 담당합니다. * 뉴런은 크게 세 가지 주요 부분으로 나뉩니다: 수상돌기(dendrite), 세포체(cell body), 축삭(axon)입니다. * 수상돌기는 다른 뉴런이나 외부 자극으로부터 신호를 받아들이는 역할을 하며, 세포체는 이 신호를 처리하고 통합합니다. * 처리된 신호는 축삭을 통해 다음 뉴런이나 근육, 혹은 샘과 같은 다른 조직으로 전달됩니다. * 축삭의 끝에는 시냅스(synapse)가 있어 화학적 신호 또는 전기적 신호를 통해 다른 세포와 연결됩니다. * 뉴런은 이러한 작용을 통해 신경계가 복잡한 정보를 효율적으로 처리하고 전달할 수 있도록 돕습니다. 2. 인공 신경망* 인공 신경망(Ar..

17. 손글씨 데이터셋

참고 사이트https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_digits.html load_digitsGallery examples: Release Highlights for scikit-learn 1.3 Recognizing hand-written digits A demo of K-Means clustering on the handwritten digits data Feature agglomeration Various Agglomerative Clu...scikit-learn.org 예시 1)# PyTorch 관련 라이브러리 및 시각화 도구, 데이터셋 로드 라이브러리 임포트import torch # PyTorch 라이브러리..

16. 슈퍼스토어 마케팅 캠페인 데이터셋

1. 슈퍼스토어 마케팅 캠페인 데이터셋데이터셋은 Superstore 마케팅 캠페인 데이터를 포함하고 있으며, 고객의 인구통계학적 정보(예: 출생 연도, 학력, 결혼 상태, 소득), 가구 구성(어린이와 십대 자녀 수), 구매 기록(와인, 육류, 생선 등 다양한 제품군에 대한 지출), 구매 채널(매장, 웹사이트, 카탈로그), 그리고 고객의 마케팅 캠페인 참여 여부 및 불만 기록 등을 담고 있습니다. 이 데이터는 고객의 행동 패턴과 마케팅 전략의 효과를 분석하는 데 유용합니다링크 : https://www.kaggle.com/datasets/ahsan81/superstore-marketing-campaign-dataset Superstore Marketing Campaign DatasetSample custom..

15. 호텔 예약 수요 데이터셋

1. 호텔 예약 수요 데이터셋데이터셋은 일반적으로 호텔 예약에 대한 수요 패턴을 분석하기 위한 데이터셋입니다. 이 데이터셋은 예약 취소, 체크인 날짜, 고객 유형, 체류 기간, 객실 유형, 예약 경로 등 다양한 요소를 포함하며, 주로 예약 트렌드 분석, 고객 행동 예측, 수요 예측 등에 사용됩니다. 데이터 다운받아서 구글 드라이브에 첨부해줍니다.링크 주소 : https://www.kaggle.com/datasets/jessemostipak/hotel-booking-demand/data Hotel booking demandFrom the paper: hotel booking demand datasetswww.kaggle.com 2. 데이터셋 컬럼 설명* hotel: 호텔 유형 (Resort Hotel, C..

14. 파이토치로 구현한 논리 회귀

1. 논리 회귀(Logistic Regression)* 논리 회귀(Logistic Regression)는 주어진 입력 데이터를 기반으로 두 가지 이상의 범주로 분류하는 지도 학습 알고리즘입니다. * 주로 이진 분류 문제에 사용되며, 입력 변수의 선형 결합을 통해 특정 사건이 발생할 확률을 예측합니다. * 이 알고리즘은 시그모이드(Sigmoid) 함수 또는 로지스틱 함수라는 비선형 함수를 사용하여 예측값을 0과 1 사이의 확률로 변환합니다. * 모델의 결과는 일반적으로 특정 임계값(예: 0.5)을 기준으로 두 범주 중 하나로 분류됩니다. * 예를 들어, 이메일이 스팸인지 아닌지를 판별하거나 환자의 병 진단 여부를 예측하는 데 사용될 수 있습니다. * 논리 회귀는 계산이 비교적 간단하고 해석이 용이하여 머신..

13. 서울 자전거 공유 수요 예측 데이터셋

1. 서울 자전거 공유 수요 데이터셋* 서울시의 공공자전거 대여 서비스인 ‘따릉이’의 대여 수요를 예측하는 문제에 사용되는 데이터셋입니다. * 특정 시간대와 날씨, 요일, 공휴일 여부, 기온, 습도 등 다양한 데이터를 활용하여 자전거 대여 수요를 예측합니다. 링크 들어가서 압축 풀구 다운받아서 구글 드라이브에 첨부해준다링크 주소 : https://www.kaggle.com/datasets/joebeachcapital/seoul-bike-sharing/data Seoul Bike Sharing Demand PredictionPredict demand for shared bikes in Seoul based on various environmental factorswww.kaggle.com 2. 데이터셋 컬..

12. 주택 임대료 예측 데이터셋

1. 주택 임대료 예측 데이터셋* House Rent Prediction Dataset은 주택 임대료를 예측하기 위한 목적으로 사용되는 데이터셋입니다. * 이 데이터셋은 주로 머신러닝 및 데이터 분석 프로젝트에서 사용되며, 주택의 다양한 특성과 위치 정보를 기반으로 임대료를 예측하는 모델을 학습하는 데 활용됩니다. 들어가서 데이터 다운받아 압축을 푼후 구글 드라이브에 넣습니다. 링크 주소 : https://www.kaggle.com/datasets/iamsouravbanerjee/house-rent-prediction-dataset/data?select=House_Rent_Dataset.csv House Rent Prediction DatasetRenting Insights: House Rent Pred..

11. 사이킷런

1.사이킷런* 사이킷런(scikit-learn)은 파이썬(Python)으로 작성된 오픈소스 머신러닝 라이브러리로, 데이터 분석과 예측 모델 구축을 위해 널리 사용됩니다. * 간단하고 일관된 인터페이스를 제공하며, 지도 학습(Supervised Learning)과 비지도 학습(Unsupervised Learning) 알고리즘을 모두 지원합니다. * 주로 분류(Classification), 회귀(Regression), 클러스터링(Clustering), 차원 축소(Dimensionality Reduction), 모델 선택(Model Selection), 전처리(Preprocessing)와 같은 다양한 작업을 수행할 수 있습니다. * 사이킷런은 효율적인 수치 계산이 가능하며, 다양한 머신러닝 알고리즘을 손쉽게 ..