개발/데이터분석
-
넘파이(NumPy) vs 판다스(Pandas)개발/데이터분석 2024. 9. 16. 14:42
넘파이(NumPy) vs 판다스(Pandas)기본 데이터 구조NumPy: - NumPy는 다차원 배열(n-dimensional array, `ndarray`)을 처리하는 라이브러리 - 주로 수치 계산에 최적화되어 있으며, 동일한 데이터 타입(예: 정수, 실수)의 데이터를 다루는 데 효율적 - 고성능의 수학 연산과 배열 연산이 가능하며, 다차원 배열을 쉽게 처리할 수 있도록 도와줌Pandas: - Pandas는 표 형식의 데이터(데이터프레임, `DataFrame`)와 1차원 시리즈(series)를 처리하는 데 최적화되어 있음 - Pandas의 핵심 구조인 `DataFrame`은 엑셀의 스프레드시트처럼 행과 열로 구성되며, 각 열에 다른 데이터 타입이 있음 - 다양한 데이터 소스(CSV, 엑셀..
-
넘파이(NumPy)개발/데이터분석 2024. 9. 16. 14:40
넘파이(NumPy)axis: 배열의 각 축rank: 축의 개수shape: 축의 길이, 배열의 크기배열 만들기np.array() 함수를 사용해서 배열을 만듭니다.대부분 리스트로부터 배열을 만들거나, 머신러닝 관련 함수 결과값이 배열이 됩니다.차원 확인- ndim 속성으로 배열 차원을 확인ex) data.ndim # 배열 만들기arr = np.array([10, 11, 12, 13, 14, 15])# 확인print(arr)# 정보 확인print(arr.ndim)print(arr.shape)print(arr.dtype) Reshape배열을 사용할 때 다양한 형태(Shape)로 변환할 필요가 있음배열에 포함된 요소가 사라지지 않는 형태라면 자유롭게 변환할 수 있음(3, 4) → (2, 6) → (4, 3) → ..
-
Numpy 배열 객체개발/데이터분석 2022. 8. 31. 16:26
넘파이란?표준 라이브러리, 과학 계산용 라이브러리벡터, 행렬 과 같은 선형대수의 표현법을 코드로 나타낼 수 있음속도가 빠르고 메모리 사용이 효율적임.선형대수 관련 함수를 제공반복문을 사용하지 않고, 연산시 병렬로 처리 넘파이 설치anconda prompt 에 접속하여 명령어를 입력하면 conda 가상환경에서 numpy모듈을 설치 할 수 있다. ml은 내가 이동하고픈 파일이며 , 각자 설치하고자 하는 파일이 있을 경우 ml대신 다른 파일명을 입력하면 된다. 파일로 이동한 후 install numpy를 입력하면 numpy관련 함수들이 설치된다. 사실 이러한 것을 거치지 않고도 jupyter notebook 에서 바로 사용할 수 있다.import numpy as np 를 입력하면 numpy를 불러들이고 앞..