본문 바로가기

728x90

전체 글

(127)
Concat, Append와 Join, Merge 데이터 결합 이번 포스팅은 데이터를 결합하기 위한 함수들을 사용해 보겠습니다. 데이터를 결합하는 방법에는 단순 결합 (Concat, Append)와 key를 기준으로 연결하는 조인(Join, Merge)이 있습니다. 먼저, 단순 연결부터 살펴보겠습니다. 단순 연결 단순 연결은 2개 이상의 데이터프레임을 열 혹은 행 방향으로 그대로 붙이는 것입니다. 아래의 함수를 이용하여 결합할 수 있습니다. pandas.concat(objs, axis=0, ignore_index=False) objs: concat을 실행할 객체의 리스트 axis: 0이면 수직으로 결합, 1이면 수평으로 결합 ignore_index: True이면 기존 index를 무시하고 0부터 시작하는 정수로 재설정 axis가 0, 1인 경우를 잘 알..
데이터 정렬 데이터 정렬 먼저 데이터프레임의 index를 기준으로 정렬하는 방법을 알아보겠습니다. 아래의 함수를 사용합니다. DataFrame.sort_index(axis=0, ascending=True, inplace=False) axis: 0이면 행 인덱스를 기준으로, 1이면 컬럼명을 기준으로 정렬 ascending: True이면 오름차순, False이면 내림차순 정렬 inplace: True면 정렬 수행 후 None 반환(실제로 DataFrame 정렬), False이면 복사본을 만들어 정렬 수행 후 이를 반환 (원본 DataFrame은 정렬되지 않음) 아래 코드에서 확인해 보겠습니다. sklearn 라이브러리의 iris 데이터를 로드하여 데이터프레임으로 만든 후, 행을 기준으로 정렬한 결과입니다. ascendi..
조건식을 이용한 데이터 탐색 및 결측값 다루기 데이터프레임의 각 컬럼에서는 조건문의 조건에 맞는 값을 가진 행을 탐색하거나 수정할 수 있습니다. 기본적으로는 아래와 같은 형식으로 조건식을 탐색합니다. DataFrame[조건식] 조건식이 1개일 경우 위 형식에 그대로 조건식을 넣어서 데이터를 필터링할 수 있습니다. 만약 조건이 여러 개라면 &(AND 연산자), | (OR 연산자)를 사용하여 연결합니다. 또한, 아래와 같은 방법으로도 필터링이 가능합니다. 이를 이용하면 원하는 컬럼을 추출하여 데이터를 수정할 수 있고 새로운 컬럼을 생성할 수도 있습니다. df.loc[조건문, '추가/변경할 컬럼명'] 위 결과에서 볼 수 있듯이, 6번 행을 추출하여 추출하고자 하는 컬럼의 데이터를 컬럼명을 통해 추출하고, 그 데이터를 오른쪽에 있는 ['별님', 50, 60..
Pandas를 이용한 Data Handling DataFrame 선언하기: pd.DataFrame() 데이터 프레임을 선언하는 방법에는 여러 가지가 있습니다. 공통적으로는 pd.DataFrame()을 사용합니다. 아래 코드는 모두 같은 데이터 프레임을 나타내고 있습니다. import numpy as np import pandas as pd dataset = np.array([['kor', 70], ['math', 80]]) df = pd.DataFrame(dataset, columns=['class', 'score']) df = pd.DataFrame(data=[['kor', 70], ['math', 80]], columns=['class', 'score']) df = pd.DataFrame({'class': ['kor', 'math'], 'scor..
AWS 전반 소개 앞으로 AWS의 다양한 기능들을 살펴볼 예정입니다. 그전에 AWS가 무엇인지 전반적인 소개를 해 보려고 합니다.AWS란Amazon Web Services AWS는 회사 아마존에서 제공하고 있는 클라우드 컴퓨팅 서비스입니다. 즉, 전 세계적으로 분포한 다른 웹 사이트나 클라이언트 측 응용 프로그램에 대해 온라인 서비스를 제공하는 서비스라고 할 수 있습니다. 이러한 구조를 Client-Server model 이라고 합니다. AWS에서 Client-Server라 함은, 다음과 같습니다.Client: 서버에 요청을 보내는 웹 브라우저나 데스크톱 애플리케이션 등Server: AWS의 가상 서버인 EC2와 같은 서비스AWS에 대해서 본격적으로 들어가기 전에 클라우드 컴퓨팅 서비스의 클라우드가 무엇인지 알아보겠습니다..
LCA - 최소 공통 조상 LCA(Lowest Common Ancestor) 알고리즘이란?트리에서의 두 정점 u, v에서 가장 가까운 공통 조상을 찾는 알고리즘입니다. 즉, 가장 가까운 공통 조상은 두 정점 u, v를 자손으로 가지는 노드들 중 깊이가 가장 깊은 노드를 의미합니다. 이 글에서는 LCA를 2가지 방법으로 구해보겠습니다. 첫 번째는 O(N)만에 구할 수 있는 알고리즘이고 두 번째 방법은 O(logN)만에 구할 수 있는 알고리즘입니다. 1. O(N) 알고리즘지금 소개해 드릴 이 방법은 간단합니다. 먼저 알고리즘부터 살펴보겠습니다.[알고리즘] 1. 두 정점 u, v의 깊이가 같은지 확인합니다. 만약 두 정점의 깊이가 다르다면 두 정점의 깊이가 같아질 수 있도록 한 칸씩 트리를 타고 올라가면서 깊이를 맞춰줍니다. 2. 두 ..
Spring Boot란 Spring Boot를 알기 전에 우선 Spring Framework가 무엇인지, 왜 Spring Boot가 탄생했는지를 알면 좋습니다. 이번 포스팅은 Spring 프레임워크/Spring Boot가 무엇인지 작성하였습니다.Spring Framework스프링 프레임워크는 엔터프라이즈 애플리케이션을 개발하기 위한 경량 프레임워크 입니다. 이게 무슨 뜻인지 하나씩 파헤쳐 보도록 하겠습니다. 우선 엔터프라이즈 애플리케이션은 비즈니스 로직이 복잡한 기능을 가지고 있는 애플리케이션 혹은 여러가지 기능을 통합한 애플리케이션 이라고 할 수 있습니다. 그럼 프레임워크는 무엇일까요?? 사실 개발자라면 프레임워크 라는 단어를 수도 없이 들어왔을 것입니다. 프레임워크는 매우 중요하고 기본적인 개념이니 다시 한 번 정의를 정리..

728x90
반응형