LLM(Large Language Model)의 기초(29)
-
3. Matplotlib
1. Matplotlib* Matplotlib은 파이썬에서 데이터를 시각화하는 데 널리 사용되는 강력한 라이브러리입니다.* 다양한 그래프와 차트를 그릴 수 있으며, 선 그래프, 막대그래프, 히스토그램, 산점도 등 기본적인 그래프부터 복잡한 3D 플롯까지 지원합니다.* 사용법이 비교적 간단하고, 커스터마이징이 가능하여 데이터의 패턴과 트렌드를 효과적으로 표현할 수 있습니다.* 또한, NumPy와 Pandas와 같은 데이터 분석 라이브러리와 잘 통합되어 데이터 과학, 머신러닝, 통계 등 다양한 분야에서 활용됩니다.* Matplotlib의 기본 모듈인 pyplot은 MATLAB과 유사한 인터페이스를 제공해 초보자도 쉽게 사용할 수 있도록 설계되었습니다. > 공식 사이트 : https://matplotlib.o..
2024.12.19 -
4. Online Retail 데이터셋
1. 캐글* 캐글(Kaggle)은 데이터 과학자와 머신러닝 엔지니어들이 학습, 협업, 경쟁할 수 있는 온라인 플랫폼입니다.* 구글에 소속된 이 플랫폼은 다양한 데이터셋과 머신러닝 문제를 제공하며, 사용자들이 자신의 모델을 개발하고 성능을 경쟁적으로 평가받을 수 있는 경진대회도 열립니다.* 초보자는 데이터를 다루는 실습을 하고, 경험 많은 전문가들은 포트폴리오를 확장하거나 상금을 받을 기회를 얻을 수 있습니다.* 또한, 커뮤니티 포럼과 튜토리얼, 노트북 공유를 통해 지식을 공유하고 학습할 수 있는 환경을 제공합니다.* 캐글은 데이터 분석과 머신러닝을 배우고 실제 문제에 적용해 보고 싶은 사람들에게 유용한 플랫폼입니다.>공식 사이트 : https://www.kaggle.com/ Kaggle: Your Mac..
2024.12.18 -
2-2) 판다스(Pandas)
판다스가 길어서 2로 이어서 하겠습니다. 예시 결과물은 길어서 캡쳐본 저장하였으니 궁금하시면 펼쳐보시면 됩니다. 평균과 중앙값 뒤부터 하겠습니다. 예시 1)df_copy['height'].max() # 최대값-->182.0 예시 2)df_copy['height'].var() # 분산-->52.203567251462 예시 3)df_copy['height'].std() # 표준편차-->7.225203613149044 편차 와 분산 표준편차의 공식 ※ 분산과 표준편차* 분산(Variance)과 표준편차(Standard Deviation)는 데이터가 평균에서 얼마나 퍼져 있는지를 나타내는 산포도(분포 정도)를 측정하는 지표입니다.* 분산은 데이터가 평균을 기준으로 얼마나 퍼져 있는지를 나타냅니다.* 평균에서..
2024.12.18 -
2. 판다스(Pandas)
1. 판다스(Pandas)* 판다스(Pandas)는 데이터 분석을 위한 파이썬 라이브러리 중 하나로, 표 형태의 데이터나 다양한 형태의 데이터를 쉽게 처리하고 분석할 수 있도록 도와주는 도구입니다. * 주로 데이터프레임(DataFrame)이라는 자료구조를 제공하며, 이를 통해 테이블 형태의 데이터를 다루기 용이합니다. pandas 설치!pip install pandas import pandas as pd 2. Series와 DataFrame2-1. Series* Series는 1차원 배열과 같은 자료구조로 하나의 열을 나타냅니다. * 또한 각 요소는 인덱스(index)와 값(value)으로 구성되어 있습니다. * 값은 넘파이의 ndarray 기반으로 저장됩니다. * Series는 다양한 데이터 타입을 가..
2024.12.17 -
1. 넘파이(Numpy)
1. 넘파이(Numpy)* 넘파이(Numpy)는 파이썬에서 사용되는 과학 및 수학 연산을 위한 강력한 라이브러리입니다. * 주로 다차원 배열을 다루는 데에 특화되어 있어, 데이터 분석, 머신러닝, 과학 계산 등 다양한 분야에서 널리 사용됩니다. * 넘파이 배열은 C 언어로 구현되어 있어 연산이 빠르고 효율적입니다. * 특히 큰 데이터셋에서 수치 연산을 수행할 때 뛰어난 성능을 보입니다. * 또한 메모리 사용을 최적화하고 효율적으로 관리합니다.# 설치pip install numpy 1-1) numpy를 import 해주면 된다.import numpy as np 2. 넘파이의 주요 특징과 기능 2-1. 다차원 배열(N-dimensional array)* 넘파이의 핵심은 다차원 배열인 ndarray입니다. *..
2024.12.16 -
6. FAST API
1.FAST API란?* FastAPI는 Python 기반의 웹 프레임워크로, 주로 API를 빠르게 개발하기 위해 설계되었습니다.* FastAPI는 자동으로 생성되는 OpenAPI 문서(Swagger UI)를 통해 API의 사용성과 테스트를 쉽게 할 수 있으며, 데이터 유효성 검사와 타입 힌트를 활용한 코드 자동완성 및 오류 방지를 지원합니다.* 특히, 비동기 처리를 활용하여 속도가 중요한 대규모 애플리케이션 개발에 적합하며, RESTful API와 GraphQL 같은 현대적 웹 API 개발에 유용합니다. *타입 힌팅(Type Hints) * 타입 힌팅(Type Hints)은 프로그래밍 언어에서 변수, 함수 매개변수, 함수 반환값 등에 대한 데이터 타입 정보를 코드에 명시적으로 제공하는 기술입니다. ..
2024.12.13