반응형

개체, 요인, 변수의 개념

  • 개체: 연구나 관찰의 대상이 되는 것입니다. 예를 들어, 신입사원이 개체가 될 수 있습니다.
  • 요인: 개체에 대해 연구자가 관심을 가지는 특성입니다. 예를 들어, 신입사원의 신체조건이 될 수 있습니다.
  • 변수: 요인을 구성하는 구체적인 요소입니다. 예를 들어, 키, 몸무게, 가슴둘레 등이 될 수 있습니다.

 

데이터 유형

  • 범주형 데이터: 각 필드의 데이터로, 예를 들어 음료의 종류(아메리카노, 카페라떼 등)가 이에 속합니다.
  • 연속형 데이터: 각 레코드의 데이터로, 예를 들어 날짜나 온도가 이에 속합니다.
  • 독립변수와 종속변수: 데이터 분석에서 사용되는 두 가지 주요 변수 유형입니다.

 

데이터 분석 방법론

  • 범주형 데이터: 빈도 분석을 통해 분석합니다. 명목형(분류만 하는 것)과 순서형(순서가 있는 것)으로 나뉩니다.
  • 수치형 데이터: 분포 분석을 통해 분석합니다. 이산형(유한한 데이터)과 연속형(무한한 데이터)으로 나뉩니다.

 

코드 예제

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# 예시 데이터 생성
data = {
    '음료': ['아메리카노', '카페라떼', '콜드브루', '아메리카노', '카페라떼'],
    '온도': [20, 25, 22, 19, 24]
}

df = pd.DataFrame(data)

# 범주형 데이터 빈도 분석
print(df['음료'].value_counts())

# 연속형 데이터 분포 분석
plt.hist(df['온도'], bins=5)
plt.show()

 

반응형