Bài tập lớn xác suất thống kê

0
1557
Bài tập lớn xác suất thống kê
QUẢNG CÁO
Vài Phút Quảng Cáo Sản Phẩm


Bài tập lớn xác suất thống kê

Mọi ý kiến đóng góp xin gửi vào hòm thư: [email protected]

Kéo xuống để Tải ngay đề cương bản PDF đầy đủ: Sau “mục lục” và “bản xem trước”

(Nếu là đề cương nhiều công thức nên mọi người nên tải về để xem tránh mất công thức)

Đề cương liên quan:Bài tập lớn vi mạch tương tự Dùng các vi mạch tương tự tính toán, thiết kế mạch đo và cảnh báo nhiệt độ sử dụng cảm biến nhiệt điện trở kim loại


Tải ngay đề cương bản PDF tại đây: Bài tập lớn xác suất thống kê

Quảng Cáo

Bài tập lớn xác suất thống kê

Ví dụ 3.4 trang 161:

Nhấn lần lượt đơn lệnh thiết lặp các biểu thức và tính giá trị thống kê:

  • Tính các giá trị Ti…,Tj.. và T..k ,T…
  • Các giá trị Ti..

Chọn ô B8 và nhập biểu thức =SUM(B3:E3)

Chọn ô C8 và nhập biểu thức =SUM(B4:E4)

Chọn ô D8 và nhập biểu thức =SUM(B5:E5)

Chọn ô E8 và nhập biểu thức =SUM(B6:E6)

  • Các giá trị T.j.

Chọn ô B9 và nhập =SUM(B3:B6)

Dùng con trỏ kéo kí tự điền từ ô B9 tới ô E9.

  • Các giá trị T..k

Chọn ô B10 và nhập =SUM(B3,C6,D5,E4)

Chọn ô C10 và nhập =SUM(B4,C3,D6,E5)

Chọn ô D10 và nhập =SUM(B5,C4,D3,E6)

Chọn ô È10 và nhập =SUM(B6,C5,D4,E3)

  • Giá trị T..

Chọn ô B11 nhập =SUM(B3:E6)

  • Tính các giá trị G và G

-Các giá trị G và G

Chọn ô H8  nhập =SUMSQ(B8:E8)

Dùng con trỏ kéo kí hiệu điền từ ô H8 tới H10

giá trị G

Chọn ô H11 nhập =SUMSQ(B11)

giá trị G

Chọn ô H12 nhập =SUMSQ(B3:E6)

  • Tính các giá trị SSR ,SSC,SSF,SST và SSE

-Các giá trị SSR,SSC và SSF

Chọn ô J8 nhập =H8/4-39601/SUMSQ(4)

Dùng con trỏ kéo kí tự điền từ ô J8 tới J10

-Giá trị SST

Chọn ô J12 nhập =H12-H11/SUMSQ(4)

-Giá trị SSE

Chọn ô J11 và nhập =J12-(J10+J9+J8)

  • Tính các giá trị MSR, MSC,MSF và MSE

-Các giá trị MSR,MSC và MSF

Chọn ô L8 nhập =J8/(4-1)

Dùng con trỏ kí tự kéo từ ô L8 tới ô L10

Giá trị MSE

Chọn ô L11nhập =J11/(3*2)

  • tính giá trị G và F

chọn ô N8 nhập =L8/$L11

dùng con trỏ kéo kí tự từ ô N8 tới ô N10

  • kết quả và biện luận

Fr =3.1055 < F0.05(3,6) =4.76 => chấp nhận Ho(pH)

Fc=11.95 >F0.05(3,6)=4.76 =>bác bỏ Ho(nhiệt độ)

F=30.05 > F0.05 (3,6)=4.76 =>bác bỏ Ho(chất xúc tác)

Vậy chỉ có nhiệt và chất xúc tác gây ảnh hưởng đến hiệu suất.

Ví dụ 4.2 (trang 170)

Nhập số liệu vào bảng excel:

Dùng lệnh Tools và lệnh Data Analysis

Chọn chương trình Regression, lần lượt ấn định các chi tiết:

  • phạm vi của biến số Y (input Y range)
  • Phạm vi của biến số X (input X range)
  • Nhãn dữ liệu (Labels)
  • Mức tin cậy (Confidence Level)
  • Tọa độ đầu ra (output Range)
  • Và tùy chọn khác như đường hồi quy (Line Fit Plots), biểu thức sai số (residuals plots…)

Phương trình hồi quy   ŶX1=f(x1)

 

            ŶX1=2.73+0.04X1   =0.21; s=1.81)

 

 

 

 

 

 

 

 

 

 

                 
Regression Statistics                
Multiple R 0.462512              
R Square 0.213917              
Adjusted R Square 0.10162              
Standard Error 1.811192              
Observations 9              
                 
ANOVA                
  df SS MS F Significance F      
Regression 1 6.24891746 6.248917 1.904917 0.209995      
Residual 7 22.96290476 3.280415          
Total 8 29.21182222            
                 
  Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 2.726667 1.280705853 2.129034 0.070771 -0.30172 5.755055 -0.30172 5.755055
X1 0.04454 0.032270754 1.380187 0.209995 -0.03177 0.120848 -0.03177 0.120848
                 

T0=2.19<T0.05=2.365 ( hay v =0.071 >α=0.05

  • Chấp nhận giả thuyết Ho.

T1  =1.38 < T0.05=2.365 ( hay Pv =0.209 >α=0.05)

  • Chấp nhận giả thuyết Ho.

F=1.905 < 0.05=5.590 (hay s=0.209 >α=0.05)  =>Chấp nhận giả thuyết Ho.

Vậy cả 2 hệ số 2.37 (Bo) và 0.04(B1) của phương trình hồi quy

Ŷ

Đều không có ý nghĩa thống kê. Nói cách khác hồi quy này không thích hợp.

Kết Luận: yếu tố thời gian không liên quan tuyến tính tới hiệu suất của phả ứng tổng hợp.

 

 

Phương trình hồi quy  Ŷ X

            Ŷ =0.76; s=0.99)

 

 

 

 

 

SUMMARY OUTPUT                
                 
Regression Statistics                
Multiple R 0.873934              
R Square 0.76376              
Adjusted R Square 0.730011              
Standard Error 0.992904              
Observations 9              
                 
ANOVA                
  df SS MS F Significance F      
Regression 1 22.31081667 22.31082 22.63086 0.002066      
Residual 7 6.901005556 0.985858          
Total 8 29.21182222            
                 
  Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept -11.1411 3.25965608 -3.41788 0.011168 -18.849 -3.43325 -18.849 -3.43325
X2 0.128556 0.027023418 4.757191 0.002066 0.064655 0.192456 0.064655 0.192456

 

T0=3.418>T0.05=2.365 ( hay v =0.011 <α=0.05)

  • Bác bỏ giả thuyết Ho.

T2  =4.757 >T0.05=2.365 ( hay Pv =0.00206 <α=0.05)

  • Bác bỏ giả thuyết Ho.

F=22.631 > 0.05=5.590 (hay s=0.00206 <α=0.05)

  • Bác bỏ giả thuyết Ho.

Vậy cả 2 hệ số -11.14 (Bo) và 0.13(B2) của phương trình hồi quy

Ŷ

Đều có ý nghĩa thống kê. Nói cách khác hồi quy này thích hợp.

Kết Luận: yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.

 

 

 

 

Phương trình hồi quy Ŷ

            Ŷx=0.97; s=0.33)

 

SUMMARY OUTPUT                
                 
Regression Statistics                
Multiple R 0.988776              
R Square 0.977677              
Adjusted R Square 0.970236              
Standard Error 0.329669              
Observations 9              
                 
ANOVA                
  df SS MS F Significance F      
Regression 2 28.55973413 14.27987 131.3921 1.11E-05      
Residual 6 0.652088095 0.108681          
Total 8 29.21182222            
                 
  Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept -12.7 1.101638961 -11.5283 2.56E-05 -15.3956 -10.0044 -15.3956 -10.0044
X1 0.04454 0.005873842 7.582718 0.000274 0.030167 0.058912 0.030167 0.058912
X2 0.128556 0.008972441 14.32782 7.23E-06 0.106601 0.15051 0.106601 0.15051

 

T0=11.528>T0.05=2.365 ( hay v =2.260 * >α=0.05)

  • Bác bỏ giả thuyết Ho.

T2  =7.583 >T0.05=2.365 ( hay Pv =0.00207 <α=0.05)

  • Bác bỏ giả thuyết Ho.

T2  =14.328> T0.05=2.365 ( hay Pv =7.233 *  >α=0.05)

  • Bác bỏ giả thuyết Ho.

F=131.329 < 0.05=5.140 (hay Fs=1.112 *  >α=0.05)

  • Bác bỏ giả thuyết Ho.

Vậy cả 2 hệ số -12.14 (Bo) và 0.13(B2) của phương trình hồi quy

Ŷ

KếtLuận: Hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả

2 yếu tố là thời gian và nhiệt độ.

Sự tuyến tính của phương trình Ŷ x1,x2 = -12,70 + 0,04X1 + 0.13X2 có thể được trình bày trên biểu đồ phân tán. (scatterplots)

Muốn dự đoán hiệu suất của phản ứng bằng phương trình hồi quy :

Ŷx1,x2 = -12,70 + 0,04X1 + 0.13X2 bạn chỉ cần chọn 1 ô, vídụ B21, sau đó nhập hàm và được kết quả như sau:

  B21   = B17 + B18*50 + B19*115
  A B C D
17 Interrcept                                          -12.7               1.1.1638961   -11.52827782

 

X1                                        0.044539683              0.005873842     7.582717621

X2                                        0.128555556              0.008972441     14.32782351

Dựđoán 4,310873016

18
19
20
21
           

 

      

 

 

 

Câu 2: bệnh đau mắt hột được chia làm 4 thời  kì T1, T2, T3 và T4.Kết quả kiểm tra mắt hột ở 3 tỉnh A, B, C được cho trong bảng sau đây:

Địa phương Mức độ đau mắt hột
T1 T2 T3 T4
A 47 189 807 1768
B 53 746 1387 946
C 16 228 438 115

    Hãy nhận định xem tình hình đau mắt hột( cơ cấu phân bố các mức độ T1,T2,T3,T4) Ở 3 tỉnh trên có giống nhau không? Mức ý nghĩa 1%)

 

CƠ SỞ LÍ THUYT Giaû söû ta coù k taäp hôïp chính  H1, H2,… Hk. Moãi caù theå cuûa chuùng coù theå mang hay khoâng mang ñaëc tính A.

          Goïi p1 laø tyû leä coù theå mang ñaëc tính A trong taäp hôïp chính Hi (i = 1, 2, …k).

          Caùc tyû leä naøy ñöôïc goïi laø caùc tyû leä lyù thuyeát maø chuùng ta chöa bieát.

          Ta muoán kieåm ñònh giaû thieát sau:

          Ho: p1 = p2 = … = pk (taát caû caùc tyû leä naøy baèng nhau).

          Töø moãi taäp hôïp chính Hi ta ruùt ra moät ngaãu nhieân coù kích thöôùc ni, trong ñoù chuùng ta thaáy coù mi caù theå mang ñaëc tính A. caùc döõ lieäu naøy ñöôïc trình baøy trong baûng sau ñaây:

Maãu 1 2 k Toång
Coù A m1 m2 mk m
Khoâng A l1 l2 lk l
Toång n1 n2 nk N = m + l = åni

          Neáu giaû thieát

                             Ho: p1 = p2 = … = pk = p

          Laø ñuùng thì tyû leä chung p ñöôïc öôùc löôïng baèng tyû soá giöõa soá caù theå ñaëc tính A cuûa toaøn boä k maãu goäp laïi treân toång soá caù theå cuûa k maãu goäp laïi.

                           

          Tyû leä caù theå khoâng coù ñaëc tính A ñöôïc öôùc löôïng bôûi

                           

          Khi ñoù soá caù theå coù ñaëc tính A trong maãu thöù i (maãu ruùt töø taäp hôïp chính Hi) seõ xaáp xæ baèng

                             

vaø soá caù theå khoâng coù ñaëc tính A trong maãu thöù i seõ xaáp xæ baèng

          

    Caùc soá  vaø  ñöôïc goïi laø caùc taàn soá lyù thuyeát (TSLT), coøn caùc soá mi, li ñöôïc goïi laø caùc taàn soá quan saùt (TSQS).

    Ta quyeát ñònh baùc boû Ho khi TSLT caùch xa TSQS moät caùch “baát thöôøng”. Khoaûng caùch giöõa TSQS vaø TSLT ñöôïc ño baèng test thoáng keâ sau ñaây:

          

    Ngöôøi ta chöùng minh ñöôïc raèng neáu Ho ñuùng vaø caùc taàn soá lyù thuyeát khoâng nhoû thua 5 thì T seõ coù phaân boá xaáp xæ phaân boá  vôùi k – 1 baäc töï do. Thaønh thöû mieàn baùc boû Ho coù daïng {T > c}, ôû ñoù c ñöôïc tìm töø ñieàu kieän P{T > c} = a. Vaäy c chính laø phaân vò möùc a cuûa phaân boá  vôùi k – 1 baäc töï do

Nhập bảng số liệu vào Excel:

Tính các giá trị :

Tổng hàng :

  • Chọn ô F3 và nhập biểu thức =SUM(B3:E3)
  • Dùng con trỏ kéo kí hiệu tự điền từ ô F3 đến ô F5
  • Tổng cột :
  • Chọn ô B6 và nhập vào biểu thức =SUM(B3:B5)
  • Dùng con trỏ kéo kí tự điền từ ô B6 đến ô E6
  • Chọn ô F6 =sum(B6:E6)

Ta được kết quả:

Tính TSLT :

  • Chọn ô B8 và nhập vào biểu thức =B$6*$F3/$F$6
  • Dùng con trỏ kéo kí tự điền từ ô B8 đến ô D10

Ta được kết quả :

Tất cả các TSLT đều lớn hơn 5 :

Ta tính T

ta có công thức :

  • Chọn ô B12 và nhập vào biểu thức =B3*B3/(B$6*$F3)
  • Dùng con trỏ kèo kí tự điền từ ô B11 đến ô E13
  • Chọn tiếp ô B14 và nhập vào biểu thức =F6*(SUM(B11:E13)-1)
  • Ta đươc kết quả : T ≈ 1010

Tra bảng phân phối c2  (α=1%) với bậc tự do (3-1)*(4-1)=6 ta được : 16,81

Vì T>16,81 => bác bỏ H­0­

Vậy đau mắt hột ở 3 tỉnh trên khác nhau.

Câu 3: Bảng sau đây cho số liệu người chết về ung thư ở 3 nước Mỹ,Anh,Nhật.Người chết được phân loại theo cơ quan bị ung thư.

Chỗ ung thư Nước
M Nhật Anh
Ruột

 

Ngực

Dạ dày

Bộ phận khác

11

 

15

3

41

5

 

3

22

30

5

 

7

3

15

  1. a) Hãy tính tần số lí thuyết của bảng số liệu trên.
  2. b) Có thể áp dụng tiêu chuẩn c2 được không?
  3. c) Với mức ý nghĩa a = 1% hãy so sánh phân bố tỉ lệ chết về ung thư của 3 nươc nói trên.

CƠ  SỞ LÍ THUYẾT

Maãu

 

Tính traïng

1 2   J   K Toång soá
A1 n11 n12 n1j n1k n10
A2 n21 n22 n2j n2k n20
Ai ni1 ni2 nij nik ni0
Ar nr1 nr2 nrj nrk nr0
Toång soá no1 no2 noj nok n

Kyù hieäu              

                           

          Nhö vaäy noj laø kích thöôùc cuûa maãu thöù j, coøn nio laø toång soá caù theå coù tính traïng Ai trong toaøn boä k maãu ñang xeùt

                           

          Laø toång soá taát caû caùc caù theå cuûa k maãu ñang xeùt.

          Neáu giaû thieát Ho laø ñuùng nghóa laø

                           

thì caùc tyû leä chung p1, p2,…pr ñöôïc öôùc löôïng bôûi:

                           

          Ñoù öôùc löôïng cho xaùc suaát ñeå moät caù theå coù mang tính traïng Ai. khi ñoù soá caù theå coù tính traïng Ai trong maãu thöù j seõ xaáp xæ baèng

                           

          Caùc soá   

ñöôïc goïi laø caùc taàn soá lyù thuyeát (TSLT), caùc soá nij ñöôïc goïi laø caùc taàn soá quan saùt (TSQS).

          Ta quyeát ñònh baùc boû Ho khi caùc TSLT caùch xa TSQS moät caùch baát thöôøng. Khoaûng caùch giöõa TSQS vaø TSLT ñöôïc ño baèng test thoáng keâ sau ñaây

                           

          Ngöôøi ta chöùng minh ñöôïc raèng neáu Ho ñuùng vaø caùc TSLT khoâng nhoû hôn 5 thì T seõ coù phaân boá xaáp xæ phaân boá vôùi (k-1)(r-1) baäc töï do. Thaønh thöû mieàn baùc boû coù daïng {T > c} ôû ñoù c ñöôïc tìm töø ñieàu kieän P{T > c} = a. Vaäy c laø phaân vò möùc a cuûa phaân boá  vôùi (k-1)(r-1) baäc töï do.

          Chuù yù. T coù theå bieán ñoåi thaønh caùc daïng sau ñaây.

Ta coù                                                                    

Ñeå yù raèng:    

Vaäy  

Nhập bảng số liệu vào Excel , thiết lập các biểu thức và tính các giá trị thống kê.

Tính các giá trị :

  • Tổng hàng :
    • Chọn ô E2 và nhập biểu thức =SUM(B2:D2)
    • Dùng con trỏ kéo kí hiệu tự điền từ ô E2 đến ô E5
  • Tổng cột :
    • Chọn ô B6 và nhập vào biểu thức =SUM(B2:B5)
    • Dùng con trỏ kéo kí tự điền từ ô B6 đến ô E6

Ta được kết quả như hình sau :

  1. a) Ta có công thức tần số lý thuyết(TSLT ) :

               

Thao tác trên Excel :

  • Chọn ô B8 và nhập vòa biểu thức =B$6*$E2/$E$6
  • Dùng con trỏ kéo kí tự điền từ ô B8 đến ô D8
  • Dùng con trỏ kéo kí tự điền từ ô D8 xuống ô D11

Ta được kết quả sau :

b)không thể áp dụng chuẩn  c2   vì không phải TSLT đều không nhỏ hơn 5.

c.)vì có TSLT  nhỏ hơn 5.

Nên ta cần ghép 2 dòng đầu tiên :

  Mỹ Nhật Anh
Ruột+Ngực 26 8 12
Dạ dày 3 22 3
Bộ phận khác 41 30 15

Tính các giá trị :

Nhập các giá trị vào bảng Excel :

  • Chọn ô E2 và nhập vào biểu thức =SUM(B2:D2)
  • Dùng con trỏ kéo kí tự điền từ ô E2 đến ô E4
  • Chọn ô B5 và nhập vào biểu thức =SUM(B2:B4)
  • Dùng con trỏ kéo kí tự điền từ ô B5 đến ô E5

Ta được kết quả :

Tính TSLT :

  • Chọn ô B7 và nhập vào biểu thức =B$5*$E2/$E$5
  • Dùng con trỏ kéo kí tự điền từ ô B7 đến ô D9

Ta được kết quả :

Tất cả các TSLT đều lớn hơn 5 :

Ta tính T

Ta có công thức :
Từ đó ta được :

T=160 ≈

29,07

Dùng Excel

  • Chọn ô B11 và nhập vào biểu thức =B2*B2/(B$5*$E2)
  • Dùng Dùng con trỏ kèo kí tự điền từ ô B11 đến ô D13
  • Chọn tiếp ô B18 và nhập vào biểu thức =E5*(SUM(B11:D13)-1)

Ta đươc kết quả : T  ≈ 29,07

Tra bảng phân phối c2  (α=1%) với bậc tự do (3-1)*(3-1)=4ta được : 13,28

Vì T>13,28 => bác bỏ H­0­ .  Vậy tỉ lệ chết về ung thư của 3 nước là khác nhau .

Câu 4:

Theo dõi doanh thu của 4 cửa hàng của 1 công ty(triệu đ/tháng)người ta được số liệu như sau:

Tháng

 

kinh doanh

Cửa hàng
1 2 3 4
1

 

2

3

4

5

6

12,3

 

12,6

11,6

15,2

18,6

17,1

14,2

 

12,4

11,5

11,6

15,6

 

17,1

18,2

12,5

11,8

17,2

 

15,8

12,2

Hãy so sánh doanh thu trung bình/tháng của các cửa hàng thuộc công ty nói trên.  Mc ý nghĩa a = 5%.

CƠ SỞ LÍ THUYẾT

 

Dùng Excel

  • Áp dụng “Anova: Single Factor”
  1. Nhập dữ liệu theo cột
  1. Chọn mục : Anova: Single Factor
  1. Chọn các mục như hình:
  1. Kết quả
  2.  
Anova: Single Factor          
             
SUMMARY          
Groups Count Sum Average Variance    
Column 1 6 87.4 14.5667 8.1787    
Column 2 4 49.7 12.425 1.5625    
Column 3 5 75.2 15.04 7.873    
Column 4 3 45.2 15.0666 6.6533    
             
             
ANOVA            
Source of Variation SS df MS F P-value F crit
Between Groups 18.9899 3 6.3300 0.9805 0.4299 3.3439
Within Groups 90.3795 14 6.4557      
             
Total 109.3694 17        
             
  • F=MSF/MSE=0.9805<F crit=3.3439 => Chấp Nhận giả thiết H0
  • Vậy doanh thu trung bình/tháng của các cửa hàng bằng nhau

Câu 5:   . Mức ý nghĩa a = 5%. Hãy phân tích tình hình kinh doanh của 1 số ngành nghề ở 4 quận nội thành trên cơ sở số liệu về doanh thu của 1 số mặt hàng như sau::

Ngành nghề kinhdoanh Khu vực kinh doanh
Q1 Q2 Q3 Q4
Điện lạnh

 

VLXD

Dịch vụ tin học

2.5:2.7:2.0:3.0

 

0.6:10.4

1.2:1.0:9.8:1.8

3.1:3.5:2.7

 

15.0

2.0:2.2:1.8

2.0:2.4

 

9.5:9.3:9.1

1.2:1.3:1.2

5.0:5.4

 

19.5:17.5

5.0:4.8:5.2

CƠ SỞ LÍ THUYẾT:

* Kết luận :

  • Nếu FA > F n-1 ; (n-1)(m-1) ; 1-a thì bá c bỏ yếu tố A (h àng)
  • Nếu FB > F m-1 ; (n-1)(m-1) ; 1-a thì bá c bỏ yếu tố B (cột)

Nhập số liệu cho bảng:

Ta sử dụng hàm Average để tình trung bình các số liệu cho các cột:

ô J5 =SUM (C4:C7).  Kéo điền vào các ô từ J5 đến M5

ô J6 và nhập biểu thức  = SUM (C8:C10). Kéo điền từ ô J6 đến ô M6

ô J7 và nhập biểu thức  = SUM (C11:C14). Kéo điền từ ô J7 đến ô M7

Ta có bảng kết quả như sau:

Dùng lệnh “Anova: Two-Factor Without Replication”

  1. Nhấp lần lượt đơn lệnh Tools và lệnh Data Analysis.
  2. Chọn chương trình Anova: Two-Factor Without Replication trong hộp thoại Data Analysis rồi nhấp nút OK.
  3. Trong hộp thoại Anova: Two-Factor Without Replication lần lượt nhập vào như hình sau:

Kết quả biện luận:

  • FR= 4.4522 <F2,6,1-0.05 = 5,14325285 → chấp nhận giả thiết H0.

Doanh thu của các cừa hàngkhông phụ thuộc vào  ngành nghề.

  • FC= 1.26033 < F3,6,1-0.05 = 4,757062664 → Chấp nhận giả thiết H0 .

Doanh thu của các cừa hàng không phụ thuộc vào khu vực kinh doanh.


Tải xuống tài liệu học tập PDF miễn phí

[sociallocker id=”19555″] Tải Xuống Tại Đây [/sociallocker]

LEAVE A REPLY

Please enter your comment!
Please enter your name here

LEAVE A REPLY

Please enter your comment!
Please enter your name here