LLM(Large Language Model)의 기초/데이터 분석(18)
-
17. 손글씨 데이터셋
참고 사이트https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_digits.html load_digitsGallery examples: Release Highlights for scikit-learn 1.3 Recognizing hand-written digits A demo of K-Means clustering on the handwritten digits data Feature agglomeration Various Agglomerative Clu...scikit-learn.org 예시 1)# PyTorch 관련 라이브러리 및 시각화 도구, 데이터셋 로드 라이브러리 임포트import torch # PyTorch 라이브러리..
2025.01.10 -
16. 슈퍼스토어 마케팅 캠페인 데이터셋
1. 슈퍼스토어 마케팅 캠페인 데이터셋데이터셋은 Superstore 마케팅 캠페인 데이터를 포함하고 있으며, 고객의 인구통계학적 정보(예: 출생 연도, 학력, 결혼 상태, 소득), 가구 구성(어린이와 십대 자녀 수), 구매 기록(와인, 육류, 생선 등 다양한 제품군에 대한 지출), 구매 채널(매장, 웹사이트, 카탈로그), 그리고 고객의 마케팅 캠페인 참여 여부 및 불만 기록 등을 담고 있습니다. 이 데이터는 고객의 행동 패턴과 마케팅 전략의 효과를 분석하는 데 유용합니다링크 : https://www.kaggle.com/datasets/ahsan81/superstore-marketing-campaign-dataset Superstore Marketing Campaign DatasetSample custom..
2025.01.10 -
15. 호텔 예약 수요 데이터셋
1. 호텔 예약 수요 데이터셋데이터셋은 일반적으로 호텔 예약에 대한 수요 패턴을 분석하기 위한 데이터셋입니다. 이 데이터셋은 예약 취소, 체크인 날짜, 고객 유형, 체류 기간, 객실 유형, 예약 경로 등 다양한 요소를 포함하며, 주로 예약 트렌드 분석, 고객 행동 예측, 수요 예측 등에 사용됩니다. 데이터 다운받아서 구글 드라이브에 첨부해줍니다.링크 주소 : https://www.kaggle.com/datasets/jessemostipak/hotel-booking-demand/data Hotel booking demandFrom the paper: hotel booking demand datasetswww.kaggle.com 2. 데이터셋 컬럼 설명* hotel: 호텔 유형 (Resort Hotel, C..
2025.01.09 -
14. 파이토치로 구현한 논리 회귀
1. 논리 회귀(Logistic Regression)* 논리 회귀(Logistic Regression)는 주어진 입력 데이터를 기반으로 두 가지 이상의 범주로 분류하는 지도 학습 알고리즘입니다. * 주로 이진 분류 문제에 사용되며, 입력 변수의 선형 결합을 통해 특정 사건이 발생할 확률을 예측합니다. * 이 알고리즘은 시그모이드(Sigmoid) 함수 또는 로지스틱 함수라는 비선형 함수를 사용하여 예측값을 0과 1 사이의 확률로 변환합니다. * 모델의 결과는 일반적으로 특정 임계값(예: 0.5)을 기준으로 두 범주 중 하나로 분류됩니다. * 예를 들어, 이메일이 스팸인지 아닌지를 판별하거나 환자의 병 진단 여부를 예측하는 데 사용될 수 있습니다. * 논리 회귀는 계산이 비교적 간단하고 해석이 용이하여 머신..
2025.01.08 -
13. 서울 자전거 공유 수요 예측 데이터셋
1. 서울 자전거 공유 수요 데이터셋* 서울시의 공공자전거 대여 서비스인 ‘따릉이’의 대여 수요를 예측하는 문제에 사용되는 데이터셋입니다. * 특정 시간대와 날씨, 요일, 공휴일 여부, 기온, 습도 등 다양한 데이터를 활용하여 자전거 대여 수요를 예측합니다. 링크 들어가서 압축 풀구 다운받아서 구글 드라이브에 첨부해준다링크 주소 : https://www.kaggle.com/datasets/joebeachcapital/seoul-bike-sharing/data Seoul Bike Sharing Demand PredictionPredict demand for shared bikes in Seoul based on various environmental factorswww.kaggle.com 2. 데이터셋 컬..
2025.01.08 -
12. 주택 임대료 예측 데이터셋
1. 주택 임대료 예측 데이터셋* House Rent Prediction Dataset은 주택 임대료를 예측하기 위한 목적으로 사용되는 데이터셋입니다. * 이 데이터셋은 주로 머신러닝 및 데이터 분석 프로젝트에서 사용되며, 주택의 다양한 특성과 위치 정보를 기반으로 임대료를 예측하는 모델을 학습하는 데 활용됩니다. 들어가서 데이터 다운받아 압축을 푼후 구글 드라이브에 넣습니다. 링크 주소 : https://www.kaggle.com/datasets/iamsouravbanerjee/house-rent-prediction-dataset/data?select=House_Rent_Dataset.csv House Rent Prediction DatasetRenting Insights: House Rent Pred..
2025.01.07