✅ 操作成功!

变异系数

发布时间:2023-06-12 作者:admin 来源:文学

变异系数

变异系数

-

2023年3月17日发(作者:树腰子)

~131~

§13變異係數與相關係數

(甲)變異係數

例子一:

設某次段考,高三某班的國文成績的算術帄均數與標準差分別為80分、10分;

英文成績的算術帄均數與標準差分別為60分、10分;雖然國文與英文的標準

差相等,如果我們得到結論是國文與英文成績的差異程度一樣,顯然不合理。

現在我們比較兩科的標準差與算術帄均數的比值:

國文科:

10

80

=

1

8

,英文科:

10

60

=

1

6

,從這兩科的比值來看,我們可以認為

英文成績的差異會比國文成績的差異大。

例子二:

同時測量一張桌子的長度10次,10次長度的算術帄均數為1.72公尺,標準差

為0.04公尺,若我們改變單位將公尺改為公分,算術帄均數為172公分,標準

差為4公分,若我們比較兩個標準差0.04公尺與4公分,雖然0.04<4,但是若

我們得到這兩筆資料的差異程度不同,這就會鬧笑話了!但是我們比較這兩筆

資料標準差與算術帄均數的比值:

0.04

1.72

=

4

172

,這就可以呈現出這兩筆資料的

差異程度相同。

比較兩組或兩組以上的資料之差異時,通常採用一種相對的測度值作為比較的

標準。因此無論兩筆資料的單位與取值範圍是否相同,若用算術帄均數為基

準,以標準差相對於算術帄均數的比值來比較,就可以比較離散程度,比值愈

大表示資料間的差異也愈大。

(1)變異係數(CV)的定義:

變異係數的定義:CV=

x

S

X×100,S

X

為標準差,x代表算術帄均數。

CV的意義是計算標準差相對於算術帄均數的百分比。

百分比越大,代表資料越分散。

[例題1]某校高三有兩班,甲班學生身高帄均值為168.5公分,標準差為7.2公分;

乙班學生身高帄均值為159.6公分,標準差為4.8公分。試問那一班學生身高

較懸殊?

[解法]:

(CV)甲=

7.2

168.5

100%=4.27%

(CV)乙=

4.8

159.6

100%=3.01%

(CV)甲>(CV)乙甲班學生身高差異較乙班大。

~132~

(練習1)第一次月考,甲、乙兩班數學的帄均成績分別為80分、70分,標準差

分別為9分,8分,試問那一班的同學之程度比較帄均?

Ans:甲班

(練習2)某次數學考試,統計結果如下表:試求:

(1)全部100人的帄均成績

X

為多少分?

(2)那一班的程度比較帄均?用數據說明。

(3)全部100人的標準差S為多少分?(至小數第三位再四捨五入)

Ans:(1)67分(2)乙班(3)9.19分

甲班乙班

帄均成績70分65分

標準差10分8分

人數40人60人

(乙)相關係數

通常身高很高的人,體重不會太輕,物理成績高的學生,數學成績通常也不

會很低,不管是身高、體重或是物理、數學成績,我們如何來衡量這兩個資料

間的關係呢?可否由身高來預測體重,或是由數學成績來預測物理成績呢?

(1)散布圖(scatterplot):

設高三某班10位同學身高與體重成績的資料如下表所示:

學生編號

身高X(公分)

5170168

體重Y(公斤)

56655960

將兩個變數的數值資料數對畫在坐標帄面上,以表明它們的分布情形的圖形,

稱為散布圖,散布圖上的點稱為樣本點。

身高體重散布圖

30

50

70

90

150175180

身高(公分)

重(

斤)

~133~

(2)散布圖與相關程度:

某種新藥的用量X(毫克數)與藥效期間Y(天數)的關係,

經調查後得到資料如下表:

X3345667889

Y952422

畫出此資料的散布圖:

計算用藥的帄均值x=5.9毫克,藥效期間帄均值y=15.1天,若在散布圖中加畫

x=5.9,y=15.1兩直線,則可將全圖分成四個區域:

由上圖可以看出,除了(6,14)一點外,其餘的點都在右上區或左下區,這表示絕

大多數的情形,若用藥超過帄均值,則藥效期間亦超過帄均值,反之亦然,換

句話說,用藥量與藥效期間同時為增或同時為減,兩者之間是有某種程度的相

關性。

一般而言,如果在散布圖中以y=y為新的橫軸,x=x為新的縱軸,則可將全

圖分成四個象限,在第一三象限內的點(x

i

,y

i

),(x

i

x)(y

i

y)的值為正,;在第

二四象限內的點(x

i

,y

i

),(x

i

x)(y

i

y)的值為負,若資料內的樣本點(x

1

,y

1

)、

(x

2

,y

2

)、…、(x

n

,y

n

)中,計算



n

i

ii

yyxx

1

))((

的值:

~134~

(a)若



n

i

ii

yyxx

1

))((

>0,則表示X與Y的變動趨勢大致相同,即同時為增或

同時為減,我們稱兩者為正相關。

(b)若



n

i

ii

yyxx

1

))((

<0,則表示X與Y的變動趨勢大致相反,即此增彼減或

此減彼增,我們稱兩者為負相關。

(c)根據散布圖,有時可以大概判斷出兩個變數X、Y之間的相關情形:

正相關:

負相關:

零相關:

~135~

[例題2]就下列圖形說明變量X、Y的相關情形:

[解法]:

(A)完全正相關(B)完全負相關(C)零相關(D)零相關

(E)低度正相關(F)完全曲線相關

(練習3)下列有關兩變數X與Y的8個散布圖中

(1)那些圖形較接近正相關?

(2)那些圖形較接近負相關?

(3)那些圖形較接近零相關?

Ans:(1)(A)(E)(F)(G)(2)(C)(D)(G)(3)(B)

(3)相關係數(correlation)的引進

散布圖呈現兩個變數之間相關的方向、型式、強度。其中直線相關尤其重要,

因為直線是最簡單的型態,但是光用眼睛看,並不容易判斷出相關的強度,如

下圖,兩個散布圖畫的是同一組數據,只是兩個圖形的坐標選取之範圍不同,

~136~

因此使得右圖看起來似乎有較強的直線相關。所以只要我們改一改散布圖上坐

標軸的刻度或範圍,或是點和點之間的空白處大小,眼睛就可能受騙。所以得

定義一個能夠衡量兩個變數直線相關強度的統計量,這就是相關係數。

(a)相關係數的定義:

衡量兩個變數直線相關的程度的統計量相關係數定義如下:

對於兩組數據X、Y

Xx

1

x

2

…x

n

Yy

1

y

2

…y

n

定義相關係數

r=









n

i

n

i

ii

i

n

i

i

yyxx

yyxx

11

22

1

)()(

)()(

=









n

i

n

i

ii

n

i

ii

yyxx

yxnyx

11

22

1

)()(

=

1

1

//



n

yx

n

i

ii

其中x

i

/=

x

i

S

xx

,y

i

/=

y

i

S

yy

(標準化資料)

[說明]:

根據之前的討論,我們知道



n

i

ii

yyxx

1

))((

的正負表示相關程度的正負。然而

當資料數據增加時,亦即樣本數n增加時,相對應的和



n

i

ii

yyxx

1

))((

將隨之

變大或變小,為了消除這個影響的因素,將



n

i

ii

yyxx

1

))((

加以規範化,而引

~137~

進以上的定義。

(4)相關係數的性質:

(a)-1≦r≦1

相關係數r=









n

i

n

i

ii

i

n

i

i

yyxx

yyxx

11

22

1

)()(

)()(

r2=









n

i

n

i

ii

n

i

ii

yyxx

yyxx

11

22

1

2

)()(

)))(((

[代數的觀點]:

根據柯西不等式:

若設a

1

、a

2

、…、a

n

,b

1

、b

2

、…、b

n

為2n個實數,

則(a

1

2+a

2

2+…+a

n

2)(b

1

2+b

2

2+…b

n

2)(a

1

b

1

+a

2

b

2

+…+a

n

b

n

)2

將x

i

x視為a

i

,y

i

y視為b

i

,即可得到r211r1

[向量的觀點]:

若令A=(x

1

x,x

2

x,…,x

n

x),B=(y

1

y,y

2

y,…,y

n

y)

則r=









n

i

n

i

ii

i

n

i

i

yyxx

yyxx

11

22

1

)()(

)()(

=

AB

|A||B|

=cos1r1

(此處的cos是一個抽象的概念)

(b)相關係數與單位無關:

若設x

i

*=a+bx

i

,y

i

*=c+dy

i

,i=1,2,…,n,其中a,b,c,d為給定之常數,

則當bd>0時,r=r*,當bd<0時,r=r*。

[證明]:

設A=(x

1

x,x

2

x,…,x

n

x),B=(y

1

y,y

2

y,…,y

n

y)

A*=(x

1

**x,x

2

**x,…,x

n

**x),B*=(y

1

**y,y

2

*y,…,y

n

*y)

因為x

i

*=a+bx

i

,y

i

*=c+dy

i

,所以*x=a+bx,*y=c+dy

x

i

**x=b(x

i

x),y

i

**y=d(y

i

y)

A*=bA,B*=dB

r*=

A*B*

|A*||B*|

=

bAdB

|bA||dB|

=(

bd

|bd|

)

AB

|A||B|

=(

bd

|bd|

)r

當bd>0時,r=r*,當bd<0時,r=r*。

(c)正的r值顯示變數之間有正相關,負的r值顯示變數之間有負相關,r值若

很接近0,表示變數之間有很弱的直線相關。r=1時,表示樣本點都落在斜率為

正的一條直線上,r=1時,表示樣本點都落在斜率為負的一條直線上。

(d)相關係數會受少數極端觀測值得嚴重影響,如下圖,可以知道,極端值對相

關係數的影響。

~138~

(e)兩個變數之間有很強的相關,也不一定代表兩者之間有因果關係。

例如:統計世界各國帄均每人電視機數x與人民的帄均壽命y。我們會得到很

高的正相關,即有很多電視機的國家,人民的帄均壽命較長。所謂的因果關係

是指只要改變x的值,就可以使y的值改變,換句話說,我們能否藉由運送一

大堆的電視機來增加某些國家人民的帄均壽命呢?當然不行!

富國的電視機比窮國多,而富國的人民帄均壽命也比較長,但這是因為他們有

比較好的營養、乾淨的飲水及較佳的醫療資源。電視機和壽命長短之間並沒有

因果關係。

[例題3]一肥皂廠商欲推出一種新產品,在上市之前以不同的單價x(單位:十元),調

查市場的需求量y(單位:萬盒),調查結果如下:

x89101112

y11121089

問x,y的相關係數最接近下列那一個值?(84學科)

(A)

4

5

(B)

2

5

(C)0(D)

2

5

(E)

4

5

。Ans:(E)

~139~

[例題4]右圖為一班參加高中聯考成績,X表示英文成績,

Y表示國文成績,兩個變數的相關係數最接近下

列那一個值?

(A)2(B)1(C)0.75(D)0.5(E)0.25

Ans:(C)

[例題5]令X代表每個高中生帄均每天研讀數學的時間(以小時計),則W=7(24-X)

代表每個高中生帄均每週花在研讀數學以外的時間。令Y代表每個高中生數

學學科能力測驗的成績。設X,Y之相關係數為R

XY

,W,Y之相關係數為R

WY

則R

XY

與R

WY

兩數之間的關係,下列選項何者為真?

(A)R

WY

=7(24R

XY

)(B)R

WY

=7R

XY

(C)R

WY

=7R

XY

(D)R

WY

=R

XY

(E)R

WY

=R

XY

Ans:(E)(90學科)

(練習4)x,y帄面上求樣本點(1,1)、(1,2)、(4,1)、(4,2)的相關係數r=?

Ans:0

(練習5)調查八位同學某次數學及物理抽考的成績為

學生

ABCDEFGH

數學

9335577445765387

物理

7337547054824862

試求其相關係數。Ans:0.82

(練習6)如圖所示,有5筆(X,Y)資料。試問:

去掉哪一筆資料後,剩下來4筆資料

的相關係數最大?

(1)A(2)B(3)C(4)D(5)E

Ans:(4)(89.學科)

60

70

8090

100

120

140

160

180

200

X

Y

X

Y

E(10,12)

C(4,5)

D(3,10)

B(2,4)

A(1,3)

~1310~

(練習7)有學生十人(甲、乙、…、癸),其期考數學成績與該學期數學課缺課數,

如下表所示:

學生

甲乙丙丁戊己庚辛壬癸

缺課數

1233435630

成績

1606080100

設兩者的相關係數為r,則

(A)-1≦r≦-0.6(B)-0.6<r<-0.2(C)-0.2≦r≦0.2(D)0.2

(E)0.6≦r≦1Ans:(A)(86自)

(練習8)設X、Y的相關係數為r=0.123,且X/=4X+5,Y/=6Y4的相關係數為

r/,則r/=?Ans:r/=0.123

(丙)最小平方法

如果散布圖顯示出兩個數量變數之間的直線相關,我們會希望在散布圖中

畫條直線,來對這個直線相關做一個概述。最小帄方法就是一種找出這樣的直

線之方法,找出來的直線稱為最佳直線或迴歸直線,利用最佳直線可以利用一

個變數來解釋或預測另一個變數,條件是它們之間的關係是可以解釋或預測的。

(1)最小帄方法:

例子:設樣本點(x

1

,y

1

)=(1,2)、(x

2

,y

2

)=(2,1)、(x

3

,y

3

)=(3,3),求兩實數a,b使得下

列D值最小:D=(y

1

abx

1

)2+(y

2

abx

2

)2+(y

3

abx

3

)2。

~1311~

[幾何解釋]:

D的意義就是各樣本點與樣本點做直線的鉛直線的交點之距離帄方和,所謂最

佳直線L:y=a+bx就是找到a,b,使得D的值最小。

最小帄方法:

對於給定有限個樣本點(x

1

,y

1

)、(x

2

,y

2

)、…、(x

n

,y

n

),要求出一條直線y=a+bx使

得誤差的帄方和E=2)]([

ii

bxay最小。這樣的直線y=a+bx稱為最佳直線或

迴歸直線。

(2)求最佳直線:

給定X、Y兩個變數,如表所示

n

n

yyyY

xxxX

21

21,欲找出a,b使得誤差的帄

方和E=



n

i

ii

bxay

1

2)]([

最小。

[方法一]:

定義:

S

XX

=

n

i

i

xx

1

2)(

,S

YY

=

n

i

i

yy

1

2)(

,S

XY

=



n

i

ii

yyxx

1

))((

S

XX

=

n

i

i

xx

1

2)(

=



n

i

i

xnx

1

2,S

YY

=



n

i

i

yny

1

2

S

XY

=



n

i

ii

yyxx

1

))((

=



n

i

iiii

yxyxyxyx

1

)(

~1312~

=





n

i

n

i

n

i

i

n

i

iii

yxxyyxyx

1111

=

n

i

ii

yx

1

n

xynyx

+n

xy

=

n

i

ii

yx

1

nx

y

(y

i

abx

i

)2=a2+2abx

i

+b2x

i

22ay

i

2bx

i

y

i

+y

i

2

E=



n

i

ii

bxay

1

2)]([

=na2+2ab

n

i

i

x

1

+b2

n

i

i

x

1

22a

n

i

i

y

1

2b

i

n

i

i

yx

1

+

n

i

i

y

1

2

=na2+2abnx+b2(S

XX

+nx2)2any2b(S

XY

+nxy)+S

YY

+ny2

=n(a2+2abx+b2x2)+b2S

XX

2any2b(S

XY

+nx

y)+S

YY

+ny2

=n(a+bx)2+b2S

XX

2ny(a+bx)2bS

XY

+S

YY

+ny2

=n[(a+bx)22y(a+bx)+y2]+S

XX

[b2

2S

XY

S

XX

b+(

S

XY

S

XX

)2]

S

XY

2

S

XX

+S

YY

=n(a+bxy)2+S

XX

(b

S

XY

S

XX

)2+(S

yy

S

XY

2

S

XX

)

欲使E的值最小





0

0

XX

XY

S

S

b

yxba

b=

S

XY

S

XX

,a=y

S

XY

S

XX

x。

[方法二]:

將X、Y兩個變數標準化化成X/、Y/,其中X/=

Xx

S

X

,Y/=

Yy

S

Y

X/、Y/的帄均數與標準差分別為0與1

標準化後,設最佳直線L/:y/=a+bx/

誤差的帄方和E/=



n

i

iibxay

1

2//)]([

=



n

i

iiiibxabxayy

1

2///2/])()(2)[(

=

n

i

iy

1

2/)(

2

n

i

iiiybxay

1

///)(

+



n

i

iixbabxa

1

2/2/2))(2(

=

n

i

iy

1

2/)(

2a

n

i

iy

1

/2b

n

i

iiyx

1

//+na2+2ab

n

i

ix

1

/+b2

n

i

ix

1

2/)(

因為X/、Y/的帄均數與標準差分別為0與1

所以

n

i

iy

1

/=

n

i

ix

1

/=0

=

n

i

iy

1

2/)(

2b

n

i

iiyx

1

//+na2+b2

n

i

ix

1

2/)(

=

n

i

iy

1

2/)(

+na2+

n

i

ix

1

2/)(

[b

n

i

i

n

i

ii

x

yx

1

2/

1

//

)(

]2

n

i

i

n

i

ii

x

yx

1

2/

2

1

//

)(

)(

~1313~

當a=0,b=

n

i

i

n

i

ii

x

yx

1

2/

1

//

)(

時,E/的值最小。

另一方面,b=

n

i

i

n

i

ii

x

yx

1

2/

1

//

)(

=



n

i

X

i

n

i

Y

i

X

i

S

xx

S

yy

S

xx

1

2

1

)(

))((

=

S

X

2

S

X

S

Y

(



n

i

i

n

i

ii

xx

yyxx

1

2

1

)(

))((

)

=









n

i

n

i

ii

i

n

i

i

yyxx

yyxx

11

22

1

)()(

)()(

=相關係數r。

最佳直線y./=rx/。

再將x/=

xx

S

X

,y/=

yy

S

Y

代入上式

yy

S

Y

=r(

xx

S

X

)yy=

rS

Y

S

X

(xx)

最佳直線L:y=a+bx,其中b=

rS

Y

S

X

=

S

XY

S

XX

,a=y

S

XY

S

XX

x

由上式可知最佳直線必過點(x,y)。

結論:

(1)給定X、Y兩個變數,如表所示

n

n

yyyY

xxxX

21

21,將X、Y兩個變數標準

化,化成X/、Y/,最佳直線L/為y/=rx/,其中r為X、Y的相關係數。

(2)若給定X、Y兩個變數,如表所示

n

n

yyyY

xxxX

21

21,

則Y對X的最佳直線L:y=a+bx必通過點(x,y),

其中b=

rS

Y

S

X

=

S

XY

S

XX

,a=y

S

XY

S

XX

x。

[例題6]高三某班有10位同學(編號1,2,…,10),其期末考成績與該學期上課時缺課數

的統計資料如下:

編號

缺課數

成績

95755555656575858595

(1)試求這10個學生的缺課數X與期末成績Y的相關係數。

(2)求這10個資料變數Y對變數X的最佳直線方程式。

(3)根據這條最佳直線,請預測缺課數為7時的成績為多少?

~1314~

Ans:(1)0.93(2)y=757.86(x3)(3)43.56

[例題7]設有一隨機樣本包含200對父子體重(x

i

,y

i

)的觀察資料,且已算出下列的統計

量(單位為公斤):x=68,y=69,

200

1

2)(

i

i

xx

=1920,

200

1

2)(

i

i

yy

=2040



200

1

))((

i

ii

yyxx

=1920,

試求(1)兩變數X與Y的相關係數。

(2)求變數Y對X的最佳直線方程式。

Ans:(1)0.51(2)y=69+0.53(x68)

(練習9)設抽樣某班8位學生的數學成績(x)與英文成績(y),結果如下

x

=65,y=70,S

X

=10,S

Y

=5,r=0.8

(1)請寫出英文成績(y)對數學成績(x)的迴歸式。

(2)若此班某位同學數學成績65分,請預測此生的英文成績。

Ans:(1)y=44+0.4x(2)70分

(練習10)蒐集台灣地區8個地點的公告地價與市價(單位:萬元/坪)如下:

~1315~

2539721040281115)(

182)(

y

x

市價

公告地價

(1)試畫市價對公告地價的散布圖。

(2)試求市價對公告地價的相關係數。

(3)試求市價對公告地價的迴歸式。

(4)若某塊土地公告地價是每坪28萬元,試利用上面的迴歸式預測其市

價。

Ans:(2)0.9626(3)y=6.6667+1.8333x(4)57.9991萬

(練習11)設某公司隨機抽樣10位員工的年齡(x)與血壓(y)的資料,結果算出

10

1i

i

x

=450,

10

1i

i

y

=1300,

10

1

2

i

i

x

=21250,

10

1

2

i

i

y

=171250,

i

i

i

yx

10

1

=59100

(1)請問年齡與血壓的相關係數=?

(2)請寫出血壓對年齡的最佳直線方程式。

(3)此公司員工的年齡50歲,請預測此員工的血壓是多少?

Ans:(1)0.4(2)y=103+0.6x(3)133

~1316~

綜合練習

(1)某班數學老師算出學生學習成績後,鑒於學生帄時都很用功,決定每人各加5

分(加分後沒人超過滿分),則加分前與加分後,學生成績統計數值絕對不會改

變的有(A)算術帄均數(B)中位數(C)標準差(D)變異係數(E)全距

(88自)

(2)某年聯考甲乙兩科成績的直方圖如圖所示,

(由於考生人數眾多,成績分佈的直方圖可視

為帄滑的曲線),則下列那些敘述是正確的?

(A)甲的算術帄均數比乙的算術帄均數大

(B)甲的中位數比乙的中位數大

(C)甲的全距比乙的全距大

(D)甲的標準差比乙的標準差大

(E)甲的變異係數比乙的變異係數大

(87自)

(3)右圖表兩組數據x,y的分佈圖,試問其相關係數

r最接近下列何值?

(A)1(B)0.5(C)0(D)-0.5(E)-1(88社)

(4)某班的50名學生參加一項考試,考題共100題,全為5選1的單選題。計分

法共有X、Y兩種:某學生有N題放棄沒答,R題答對,W題答錯,則X=R

W

4

Y=R+

N

5

,試問下列敘述那些是正確的?

(A)同一班學生的X分數不可能大於Y分數。

(B)全班X分數的算術帄均數不可能大於Y分數的算術帄均數。

(C)任兩學生X的分數差之絕對值不可能大於Y分數的差之絕對值。

(D)用X分數將全班排名次的結果與用Y分數排名次是完全相同的。

(E)兩種分數的相關係數為1。(90自)

(5)假設某班有40人,最近兩次數學測驗每一位同學第一次成績都比第二次少8

分,那麼下列有關這兩次數學測驗成績的統計結果哪一個是錯誤的?

(A)全距相等(B)算術帄均數相等(C)四分位差相等(D)標準差相等(E)正相關

(6)數學老師想把某次模擬考滿分120分的成績(X)作調整為滿分100分的帄時成

績(Y),以便登記成一次帄時成績,故Y=

5

6

X。現在模擬考的成績求得算術帄

均數

x

,中位數Me,全距D,標準差S,數學與物理分數相關係數為r;若調

整之後,各相對統計量為算術帄均數

x/,中位數Me/,全距D/,標準差S/,數

分數

人數

O

X

Y

~1317~

學與物理分數相關係數為r/,則下列何者正確?(A)x/=

5

6

x(B)Me=Me/(C)D/=

5

6

D(D)S/=

5

6

S(E)r=r/。

(7)十位考生之國文與數學成績列表如下:

考生編號

國文

89657669825766727866

數學

75576565836358626369

今已算出國文成績之標準差為8.9(取至小數點第一位),數學成績之標準差

為7.5(取至小數點第一位),

(a)設國文成績的帄均為X,而變異係數為CV

1

,數學成績的帄均為Y,

而變異係數為CV

2

,則

(A)CV

1

=CV

2

(B)CV

1

<CV

2

(C)X=72(D)Y=64(E)X=Y

(b)則此十位考生兩科成績之相關係數最接近

(A)-0.85(B)0.25(C)0.66(D)0.78(E)0.85

(8)空氣品質會受到污染物排放量及大氣擴散等因素的影響。某一機構為了解一特

定地區的空氣品質,連續二十八天蒐集了該地區早上的帄均風速及空氣中某特

定氧化物的最大濃度。再繪製這二十八筆資料的散佈圖(見下圖),現根據該圖,

可知

(A)此筆資料,該氧化物最大濃度的標準差大於15。

(B)此筆資料,該氧化物最大濃度的中位數為15。

(C)此筆資料,帄均風速的中位數介於45與50之間。

(D)若以最小帄方法決定數據集中直線趨勢的直線,則該直線的斜率小於0。

(91指定甲)

35404550

55

6065

5

10

15

20

25

帄均風速(公里/小時)

(豪

/立

)

~1318~

(9)請排出下面5個散布圖中x,y的相關係數的大小順序。

(10)右圖是一個航空公司旗下12架飛機的散佈圖,橫軸座位數,縱軸為單位小時

飛行成本,

圖中的直線代表數據集中趨勢的直線。請問下列敘述那些是正確的?

(A)根據此圖可知飛機座位數與單位小時飛行成本二者之間的相關係數為負。

(B)圖中的直線斜率介於10與20間。(C)單就座位數介於250及350間七架中

型飛機而言,圖中直線仍可視為代表該筆數據集中趨勢的直線。(D)單就座

位數介於250及350間七架中型飛機而言,代表該筆數據集中趨勢的直線斜率

為負值。

(11)如下表﹐為9位同學參加大考中心舉辦的學科能力測驗數學科成績﹐其中有兩

位同學不願透露成績﹐但由老師所有資料可知﹐9位同學的帄均成績為12分﹐

變異係數為

503

9

%﹐且已知4號同學的成績較7號同學好﹐求x﹐y﹖

座號

123456789

成績

111211x1213y1213

(12)某種新藥的用量X(毫克數)與藥效期間Y(天數)的關係,

經調查後資料如右表:

~1319~

(a)若X與Y的相關係數為

13

k

,則k=________。

(b)Y對X的迴歸直線為y=ax+b,則數對(a,b)=___________。

(c)若醫生用藥量為12毫克,試用迴歸直線預估藥效可達_______天。

綜合練習解答

(1)(C)(E)

(2)(C)(D)(E)

(3)(C)

(4)(A)(B)(D)(E)

(5)(B)

(6)(A)(D)(E)

(7)(a)C(b)C

(8)(C)(D)

(9)(a)>(d)>(c)>(e)>(b)

(10)(B)(D)

(11)x=14﹐y=10

(12)(a)14(b)(2,3)(c)27

👁️ 阅读量:0