본문 바로가기

Python15

[Python] Pandas DataFrame 추가/수정 Pandas에서 DataFrame을 추가 및 수정하기 위해서 사용하는 몇가지 방법이 있다. 먼저 간단한 DataFrame을  생성.data = { 'Name' : ['레드', '옐로', '그린'], 'Age' : [28, 26, 24], 'City' : ['Seoul', 'Busan', 'Ansan'] }df = pd.DataFrame(data, index=['a', 'b', 'c'])   행 추가  - .concat()concat을 하면 데이터프레임을 세로로 합쳐준다.기본적으로 axis=0 이다.axis = 0일 땐 기존 데이터프레임 밑부분에 붙지만,axis = 1일 땐, 옆에 붙는다.   # 행 추가 / .concatnew_row = {"Name" : "블루", "Age" : 30, .. 2025. 1. 24.
[Python] Pandas Series와 DataFrame Pandas??Pandas는 Python의 데이터 분석 및 조작을 위한 라이브러리이다.테이블 형식의 데이터를 다루는데 최적화되어있다. ▼ 특징 - 데이터 처리 및 변환  # 데이터 필터링, 선택, 정렬  # 결측값 처리- 유연한 데이터 입출력  # CSV, JSON, HTML, SQL, Excel 등 다양한 파일 포맷 지원  # 데이터를 읽고 저장하는 함수 제공 - 연산 및 분석 기능  # 통계 계산( 평균, 분산, 중간값 등)  # 그룹화(groupby) 및 집계  Pandas 자료구조 Series와 DataFrameSeries : 1차원 데이터 구조로, 배열과 비슷하며 인덱스가 포함된다. DataFrame : 2차원 데이터구조로, 행과 열로 구성된 테이블 형식이다.  seriespd.Series() .. 2025. 1. 9.
[Python] Numpy 연산, 배열합치기, 브로드캐스팅 Numpy 연산의 특징반복문을 사용하지 않고도 내부적으로 연산이 가능하다.벡터의 같은 인덱스에 위치한 원소들끼리 연산을 수행하는 벡터화 계산을 지원Shape이 다른 배열간 연산을 자동으로 지원하는 브로드캐스팅(Broadcasting) 기능이 있다. Numpy 연산Numpy로 만든 배열의 연산이다.+, -, *, / 다 되고, 같은 인덱스에 있는 요소끼리 연산된다.   ▼사칙연산0번, 1번, 2번 인덱스끼리 연산이 되었다.   ▼sqrt, exp sqrt : 제곱근을 구해준다.exp : 지수함수 계산  배열 합치기hstack : 수평 합치기vstack : 수직 합치기column_stack : 열 기준 합치기 배열 나누기hsplit : 수평 분할vsplit : 수직 분할  브로드 캐스팅 - 서로 다른 크기의.. 2024. 12. 18.
[Python] Numpy reshape(), resize() Numpy 배열형태 변경 방법으로는 reshape()와 resize가 있다.  ▼ reshape() -  np.reshape(배열, (행, 열)) - 배열의 형태를 변경하지만, 기존 배열의 데이터 크기를 유지 - 새롭게 지정한 shape의 총 원소개수는 기존 배열의 원소개수와 같아야한다.   ( 동일하지 않으면  오류)행 또는 열에 -1을 넣은 경우?np.reshape(arr, (-1, 3) 또는 np.reshape(arr, (3, -1)위와 같이 넣는 경우가 있다.행에 넣은 경우입력된 열에 맞춰서 배열이 자동생성된다.열에 넣은 경우입력된 행에 맞춰서 배열이 자동생성된다.▼ resize() - np.resize(배열, (행, 열)) - 배열의 형태를 변경하면서, 새로운 크기에 맞게 배열을 조정 - 새 s.. 2024. 12. 16.
[Python] Numpy 속성확인, 배열생성 메서드, 인덱싱 Numpy ( Numerical Python ) 다차원 배열(ndarray)과 수치계산을 효율적으로 처리하기위한 라이브러리배열의 형태, 크기, 데이터 타입을 지정할 수 있다.크기가 다른 배열간에도 연산이 가능하도록 자동으로 크기를 맞춘다.필요한 때,크롤링 데이터에서 수치계산이 필요할 때데이터 배열 연산이나 변환이 필요할 때  Ndarray 타입N-dimension array의 약자. 다차원 배열을 의미한다.## 배열은 동일한 자료형으로 통일되어야한다. numpy를 import해서 가져오고일반적인 이차원리스트를 ndarray타입의 배열로 바꿔주었다.▼ 결과[[1 2 3] [ 4 5 6]]type(b)로 type을 확인한다면, numpy.ndarray를 확인할 수 있다.  ▼ 배열의 속성 확인 ▼ 배열 접근.. 2024. 12. 16.
[Python] 람다식 ( Lambda Expressions ) ▶ 람다식# 람다식변수 = lambda 매개변수 : 표현식코드가 간결하고, 불필요한 루프문의 작성을 없앨수있다.  ▶ 일반함수와 람다식사용의 차이람다식은 일반적으로 def 키워드를 사용해서 만드는 함수와 달리,이름 없이 한줄로 간단히 정의할 수 있다. ▶ 매개변수의 개수람다함수에 매개변수를 2개 넣고싶다면,-> lambda x, y : 표현식함수 뒤에 인수를 직접 넣을수 있다.  ▶람다와 자주 쓰이는 함수  ▶ map() 함수map() 함수 : 여러 데이터를 받아서 각 요소에 함수를 적용시켜줌받은 값은 리스트화를 해서 데이터를 받아야한다.리스트화 하지 않고 출력하면, 그 데이터가 저장된 메모리의 위치가 출력된다.     ▶ filter() 함수filter() 함수 : 주어진 조건에 해당하는 데이터를 추출.. 2024. 12. 13.