포아송 회귀분석 예제

Cód: --- | Fabricante: ---
Publicado em: Sem categoria

드문 이벤트에 대한 푸아송 근사치 설명에 나타나는 다음 수량을 식별하고 설명합니다: 푸아송 회귀에 대한 매개 변수를 추정할 때 일반적으로 θ에 대한 값을 찾으려고 시도하여 양식의 식 이제 우리는 데이터 프레임으로 작동합니다. 푸아송 분포 모델을 사용하면 일부 예측 변수가 응답 변수에 미치는 영향을 파악하려고 합니다. 여기서, 브레이크는 응답 변수이고 양모와 장력은 예측 변수이다. 설명이 매우 길기 때문에 다음 몇 페이지에서는 SAS로 먼저 작업하는 데이터 계산에 대해 푸아송 회귀 모델을 사용한 다음 R을 사용하여 다음 페이지를 살펴보겠습니다. 각 예제에는 하나 이상의 설명 변수를 사용하여 응답을 예측하는 작업이 포함되지만 이러한 예제에는 일부 시간 또는 공간 단위당 계산되는 응답 변수가 있습니다. 푸아송 랜덤 변수는 종종 카운트를 모델링하는 데 사용됩니다. 푸아송 분포의 속성은 3장을 참조하십시오. 푸아송 랜덤 변수는 개수이므로 최소값은 0이고 이론적으로 최대값은 무한합니다. 하나 이상의 공변량 함수로 시간 또는 공간 단위당 평균 발생 횟수인 (lambda)를 모델링합니다. 예를 들어 위의 첫 번째 질문에서 (lambda_i)는 주 (i)에 대해 1년 동안 오토바이 사망자의 평균 수를 나타내며 (lambda_i)의 상태 간 변동성을 주 헬멧 법에 의해 설명할 수 있음을 보여주기를 희망합니다. EDA의 다음 단계는 데이터에 초과 영점이 포함되어 있다고 의심되는 경우에 특히 유용합니다. 그림 4.10b는 푸아송 모델에서 볼 것으로 예상할 수 있는 것입니다.

막대는 푸아송 분포(푸아송 확률 수식 사용)의 확률을 (lambda)와 함께 주말당 평균 관찰된 음료 수와 같음, 2.013잔의 음료를 나타냅니다. 이 푸아송 분포를 우리가 관찰한 것과 비교하면(그림 4.10a), 설문조사 관측이 푸아송 분포에서 오는지 여부를 확인하기 위해 기대하는 것보다 더 많은 영점을 학생들에 의해 보고된 것이 분명합니다. 설문 응답자의 하위 집합이 음주자가 아닌 것으로 예상했기 때문에 이것은 놀랍지 않습니다. 즉, 이 푸아송 프로세스에는 포함되지 않습니다. 이 상황은 실제로 많은 푸아송 회귀 설정에서 발생합니다. 우리는 (lambda)를 마시는 사람들의 평균 음료 수로 정의하고(alpha)는 비음주자의 비율(“진정한 영점”)으로 정의합니다. 그런 다음 성별, 1년차 상태 및 교외 거주지와 같은 동변량(lambda) 및 알파)의 (lambda) 및 알파의 기능을 동시에 모델링하려고 시도합니다.

Compartilhe