UXO Studio
  • 응용 통계학 03 : 확률변수와 확률분포, 자료의 대푯값
    2024년 09월 13일 17시 29분 00초에 업로드 된 글입니다.
    작성자: UXO Studio

     

     

    01 확률변수

    02 확률분포

    03 확률변수의 종류

    04 자료의 대푯값

     

     

     


    01 확률변수

     : 실험 결과를 숫자로 나타낸 것으로 서로 다른 값을 가진다.

     

     

     

     

    02 확률분포

     : 어떤 실험의 가능한 모든 결과와 각 실험 결과 별 확률의 나열

     

     

     확률분포의 특징

     - 특정실험결과의 확률은 0과 1 사이의 값을 가진다.

     -  실험결과들은 상호배타적인 사건이다.

     -  모든 결과는 포괄적이다. 따라서 모든 사건의 확률 합계는 1이다.

     

     

     확률변수(X)의 분포를 확률분포라고 하고 p(x)로 표시

     - 이산확률변수의 분포함수는 이산확률분포

     

     

     ex) 동전을 세 번 던져서 나오는 앞면의 수에 대한 확률분포 찾기

    가능한
    결과
    동전 던지기 앞면이
    나온 갯수
    첫 번째 두 번째 세 번째
    1 T T T 0
    2 T T H 1
    3 T H T 1
    4 T H H 2
    5 H T T 1
    6 H T H 2
    7 H H T 2
    8 H H H 3
    앞면이 나온 수 X 실험 결과의 확률값 P(X)
    0 1/8
    1 3/8
    2 3/8
    3 1/8
    총계 8/8 = 1

     

     

     

     

    03 확률변수의 종류

     

     

    031 이산확률변수

     : 명백하게 분리된 숫자를 가지는 확률변수(유한, 무한)

     - 일반적으로는 정수이나 반드시 정수일 필요는 없음

     ex) 이산학률변수의 예

        동전을 3번 던져서 나온 앞면의 숫자

        어떤 학급에서 A 학점을 받은 학생 숫자

        금일 2교대 근무시간에 결근한 작업자의 숫자

        오늘 저녁 8시부터 11시까지 SBS에서 방영된 30초짜리 광고의 수

        피겨스케이트경기에서 심판들이 부여하는 점수(7.2, 8.9, 9.7 등으로 표시되며 8.34 또는 8.347로는 표시되지 않음)

     

     

     032  연속확률변수

     : 주어진 범위내에서 어떠한 실수 값이라도 가질 수 있는 확률변수

     - 확률변수는 23.5°, 18.3°, -2.3°와 같이 다양한 값을 가짐

     ex) 연속확률변수의 예

        40대 남성의 허리사이즈

        대학을 졸업한 졸업생의 평균평점

        인천공항에서 LA까지의 비행시간

        자동차의 타이어 공기압(psi: pound per square inch의 약자)

     

     

     

     

    04 자료의 대푯값

     

     

    041 위치를 나타내는 척도

     

     

     중앙값

     ex) FOMC 점도표

     

     최빈값

     

     

     평균

     - 자주 사용함

     - 무게 중심과 같음

     - 이상치에 취약함

     

     

    042 변동성을 나타내는 척도

     

     

     범위 R = Xmax - Xmin

     

     

     편차 d = X - x̄

     - 편차의 합은 0

     

     

     절대편차 |d|

     - 미분이 안됨 (연속하지 않기 때문) 

     

     

     분산 S² = d² / (n-1)

     

     

     표준편차 S

     - 앞선 대푯값들의 단점들을 최대한 보완한 대표푯값이지만 스케일이 반영되지 않음

     

     

    042 모집단과 표본의 대푯값

      모집단 표본
    평균 μ
    분산 σ S
    표준편차 σ² S

     - 모집단과 표본의 평균, 분산, 표준편차는 같을 수도 있

     

     

     

     

    #확률변수 #확률분포 #이산확률변수 #연속확률변수 #자료의대푯값 #확률 #중앙값 #최빈값 #평균 #편차 #분산 #표준편차 #모집단 #표본 #통계학 #데이터분석 #데이터분포 #확률모델 #확률통계 #위치를나타내는척도 #변동성을나타내는척도 #자료분석 #통계분석

    댓글