✅ 操作成功!

灰色理论

发布时间:2023-06-12 作者:admin 来源:文学

灰色理论

灰色理论

-

2023年3月16日发(作者:慕课网官网)

灰色系统理论及其应用

第一章灰色系统的概念与基本原理

1.1灰色系统理论的产生和发展动态

1982年,北荷兰出版公司出版的《系统与控制通讯》杂志

刊载了我国学者邓聚龙教授的第一篇灰色系统理论论文”灰色系

统的控制问题”,同年,《华中工学院学报》发表邓聚龙教授的第

一篇中文论文《灰色控制系统》,这两篇论文的发表标志着灰色

系统这一学科诞生。

1985灰色系统研究会成立,灰色系统相关研究发展迅速。

1989海洋出版社出版英文版《灰色系统论文集》,同年,英

文版国际刊物《灰色系统》杂志正式创刊。目前,国际、国内

300多种期刊发表灰色系统论文,许多国际会议把灰色系统列为

讨论专题。国际著名检索已检索我国学者的灰色系统论著3000

多次。灰色系统理论已应用范围已拓展到工业、农业、社会、经

济、能源、地质、石油等众多科学领域,成功地解决了生产、生

活和科学研究中的大量实际问题,取得了显著成果。

1.2几种不确定方法的比较

(系统科学---系统理论)概率统计,模糊数学和灰色系统

理论是三种最常用的不确定系统研究方法。其研究对象都具有某

种不确定性,是它们共同的特点。也正是研究对象在不确定性上

的区别,才派生了这三种各具特色的不确定学科。

模糊数学着重研究“认识不确定”问题,其研究对象具有“内

涵明确,外延不明确”的特点。比如“年轻人”内涵明确,但要

你划定一个确定的范围,在这个范围内是年轻人,范围外不是年

轻人,则很难办到了。

概率统计研究的是“随机不确定”现象,考察具有多种可

能发生的结果之“随机不确定”现象中每一种结果发生的可能性

大小。要求大样本,并服从某种典型分布。

灰色系统理论着重研究概率统计,模糊数学难以解决的“小

样本,贫信息”不确定性问题,着重研究“外延明确,内涵不

明确”的对象。如到2050年,中国要将总人口控制在15亿到

16亿之间,这“15亿到16亿之间“是一个灰概念,其外延很清

楚,但要知道具体数值,则不清楚。

三种不确定性系统研究方法的比较分析

项目灰色系统概率统计模糊数学

研究对象贫信息不确

随机不

确定

认知不确

基础集合灰色朦胧集康托

模糊集

方法依据信息覆盖映射映射

途径手段灰序列算子频率统

截集

数据要求任意分布典型分隶属度可

布知

侧重点内涵内涵外延

目标现实规律历史统计

规律

认知表达

特色小样本大样本凭经验

1.3灰色系统理论的基本概念

定义1.3.1信息完全明确的系统称为白色系统。

定义1.3.2信息未知的系统称为黑色系统。

定义1.3.3部分信息明确,部分不明确的系统称为灰色系

统。

在工程技术、社会、经济、农业、生态、环境等各种系统中

经常会遇到信息不完全的情况。比如:农业方面,农田耕作面积

往往因许多非农业的因素而改变,因此很难准确计算农田产量、

产值,这是缺乏耕地面积信息;生物防治方面,害虫与天敌间的

关系即使是明确的,但天敌与饵料、害虫与害虫间的许多关系却

不明确,这是缺乏生物间的关联信息;一项土建工程,尽管材料、

设备、施工计划、图纸是齐备的,可是还很难估计施工进度与质

量,这是缺乏劳动力及技术水平的信息;一般社会经济系统,除

了输出的时间数据列(比如产值、产量、总收入、总支出等)外,

其输入数据列不明确或者缺乏,因而难以建立确定的完整的模

型,这是缺乏系统信息;工程系统是客观实体,有明确的“内”、

“外”关系(即系统内部与系统外部,或系统本体与系统环境),

可以较清楚地明确输入与输出,因此可以较方便地分析输入对输

出的影响,可是社会、经济系统是抽象的对象,没有明确的“内”、

“外”关系,不是客观实体,因此就难以分析输入(投入)对输出

(产出)的影响,这是缺乏“模型信息”(即用什么模型,用什么

量进行观测控制等信息)。信息不完全的情况归纳起来有:元素

(参数)信息不完全;结构信息不完全;关系信息(特指“内”、

“外”关系)不完全;运行的行为信息不完全。

一个商店可看作是一个系统,在人员、资金、损耗、销售信

息完全明确的情况下,可算出该店的盈利大小、库存多少,可以

判断商店的销售态势、资金的周转速度等,这样的系统是白色系

统。

遥远的某个星球,也可以看作一个系统,虽然知道其存在,

但体积多大,质量多少,距离地球多远,这些信息完全不知道,

这样的系统是黑色系统。

人体是一个系统,人体的一些外部参数(如身高、体温、脉

搏等)是已知的,而其他一些参数,如人体的穴位有多少,穴位

的生物、化学、物理性能,生物的信息传递等尚未知道透彻,这

样的系统是灰色系统。

显然,黑色、灰色、白色都是一种相对的概念。世界上没有

绝对的白色系统,因为任何系统总有未确知的部分,也没有绝对

的黑色系统,因为既然一无所知,也就无所谓该系统的存在了。

1.4灰色系统理论的基本原理

公理1(差异信息原理)“差异“即信息,凡信息必有差异。

公理2(解的非唯一性原理)信息不完全,不确定的解是非

唯一的。

公理3(最少信息原理)灰色系统理论的特点是充分开发利

用已占有的“最少信息“。

公理4(认知根据原理)信息是认知的根据。

公理5(新信息优先原理)新信息对认知的作用大于老信息。

公理6(灰性不灭原理):

“信息完全”是相对的,“信息不完全”是绝对的。

1.5灰色系统理论的主要内容

灰色系统理论经过20多年的发展,现在已经基本建立起一

门新兴学科的结构体系。其主要内容包括以灰色代数系统,灰色

方程、灰色矩阵等为基础的理论体系。以灰色序列生成为基础的

方法体系,以灰色关联空间为依托的分析体系。以灰色模型(GM)

为核心的模型体系,以系统分析,评估,建模,预测,决策,控

制,优化为主体的技术体系。

灰色系统的特点

灰色系统理论以“部分信息已知、部分信息未知”的“小样

本”、“贫信息”不确定型系统的研究对象。

(1)用灰色数学来处理不确定量,使之量化。

在数学发展史上,最早研究的是确定型的微分方程,即在拉

普拉斯决定论框架内的数学。他认为一旦有了描写事物的微分方

程及初值,就能确知事物任何时候的运动。随后发展了概率论与

数理统计,用随机变量和随机过程来研究事物的状态和运动。模

糊数学则研究没有清晰界限的事物,如儿童和少年之间没有确定

的年龄界限加以截然划分等,它通过隶属函数来使模糊概念量

化,因此能用模糊数学来描述如语言、不精确推理以及若干人文

科学。灰色系统理论则认为不确定量是灰数,用灰色数学来处理

不确定量,同样能使不确定量予以量化。

不确定量量化(用确定量

的方法研究)

1、概率论与数理统计;2、模糊数学;3、灰

色数学(灰色系统理论)

(2)充分利用已知信息寻求系统的运动规律。

研究灰色系统的关键是如何使灰色系统白化、模型化、优化。

灰色系统视不确定量为灰色量。提出了灰色系统建模的具体

数学方法,它能利用时间序列来确定微分方程的参数。灰色预测

不是把观测到的数据序列视为一个随机过程,而是看作随时间变

化的灰色量或灰色过程,通过累加生成和累减生成逐步使灰色量

白化,从而建立相应于微分方程解的模型并做出预报。这样,对

某些大系统和长期预测问题,就可以发挥作用。

(3)灰色系统理论能处理贫信息系统。

灰色预测模型只要求较短的观测资料即可,这和时间序列分

析,多元分析等概率统计模型要求较长资料很不一样。因此,对

于某些只有少量观测数据的项目来说,灰色预测是一种有用的工

具。

1.6灰数

灰数是灰色系统理论的基本“单元“或”细胞“。我们把

只知道大概范围而不知道其确切值的数称为灰数。在应用中,灰

1,2,3

数实际上指在某一个区间或某个一般的数集内取值的不确定数。

通常用记号“”表示灰数。

灰数有以下几类:

1.仅有下界的灰数。有下界而无上界的灰数记为∈

[,]a

,其中a是灰数的下确界,是确定的数,我

们称[,]a

为的取数域,简称的灰域。

2.仅有上界的灰数。有上界而无下界的灰数记为∈

[,]a

,其中a

是灰数的上确界,是确定的数。

3.区间灰数。既有下界又有上界的灰数称为区间灰数,

记为∈[,]aa





4.连续灰数与离散灰数。

5.黑数与白数。当∈[,],称为黑数;当∈

[,]aa





且aa





时,称为白数。

6.本征灰数与非本征灰数。

本征灰数是指不能或暂时还不能找到一个白数作为其“代

表”的灰数,比如一般的事前预测值,宇宙的总能量等。

非本征灰数是指凭先验信息或某种手段,可以找到一个白数

作为其代表的灰数。我们称此白数为相应灰数的白化值。

第二章序列算子与灰色序列生成

灰色系统理论的主要任务之一,是根据社会,经济,生态

等系统的行为特征数据,寻找不同系统变量之间或某些系统变

量自身的数学关系和变化规律。灰色系统理论认为任何随机过

程都是在一定幅值范围和一定时区内变化的灰色量,并把随机

过程看成灰色过程。

灰色系统理论是通过对原始数据的挖掘,整理来寻求其变

化规律的,这是一种就数据寻找数据的现实规律的途径,我们

称为灰色序列生成。灰色系统理论认为,尽管客观系统表象复

杂,数据离乱,但它总是有整体功能的,因此必然蕴含某种内

在规律。关键在于如何选择适当的方式去挖掘它和利用它。一

切灰色序列都能通过某种生成弱化其随机性,显现其规律性。

例如考虑4个数据,记为)4(),3(),2(),1()0()0()0()0(XXXX,其数

据见下表:

序号

1234

符号)1()0(X)2()0(X)3()0(X)4()0(X

数据

121.54

将上表数据作图得

0

1

2

3

4

5

1234

X

Y

上图表明原始数据)0(X没有明显的规律性,其发展态势是

摆动的。如果将原始数据作累加生成,记第K个累加生成为

)()1(KX,并且

1)1()1()0()1(XX

321)2()1()2()0()0()1(XXX

5.45.121)3()2()1()3()0()0()0()1(XXXX

5.735.121)4()3()2()1()4()0()0()0()0()1(XXXXX

得到数据如下表所示

序号

1234

符号)1()1(X)2()1(X)3()1(X)4()1(X

数据134.57.5

0

1

2

3

4

5

6

7

8

1234

X

Y

上图表明生成数列X(1)是单调递增数列。

2.1冲击扰动系统与序列算子

定义2.1.1设

0000((1),(2),,())Xxxxn为系统真实行为序列,而观

察到的系统行为数据序列为

0000

12

((1),(2),,())((1),(2),,())

n

XxxxnxxxnX

其中,

12

(,)

n

为冲击扰动项(干扰项)。X称为冲击扰

动序列。

所以本章我们的讨论围绕:由XX0展开(扰动还原真实)

2.2缓冲算子公理

定义2.2.1设系统行为数据序列为((1),(2),,())Xxxxn,

1.若2,3,,()(1)0knxkxk,则称X为单调增长序列;

2.若1中不等号反过来成立,则称X为单调衰减序列;

3.若,{2,3,},()(1)0,()(1)0kknxkxkxkxk



有,则称X

为随机振荡序列。

4.设max()|12,3,,,()|12,3,,Mxkknmxkkn,,,则称

M-m为序列X的振幅

定义2.2.2设((1),(2),,())Xxxxn为系统行为数据系列,D

为作用于X的算子,X经过算子D作用后所得序列记为

((1),(2),,())XDxdxdxnd

称D为序列算子,称XD为一阶算子作用序列。

序列算子的作用可以多次,相应的,若

123

,,DDD都是序列算子,

我们称

12

DD为二阶算子,并称

12121212

((1),(2),,())XDDxddxddxndd

为二阶算子作用序列,同理,

123

DDD为三阶序列算子……

定义2.2.3称下述三公理为缓冲算子三公理,满足缓冲算

子三公理的序列算子D称为缓冲算子,一阶,二阶,三阶……

缓冲算子作用序列称为一阶,二阶,三阶……缓冲序列。

公理1(不动点公理)设((1),(2),,())Xxxxn为系统行为

数据系列,D为序列算子,则D满足()()xndxn。

不动点公理限定在序列算子作用下,系统行为数据序列的

数据()xn保持不变。

根据定性分析的结论,亦可使()xn以后的若干个数据在序列

算子作用下保持不变。例如,令

()()()()xjdxjxidxi且

,1,2,1,1,,.jkikkn其中

公理2.(信息充分利用公理)系统行为数据序列X中的每

一个数据(),1,2,xkk,都要充分地参与算子的作用全过程

公理3(解析化、规范化公理)任意的(),(1,2,xkdk,

皆可由一个统一的(1),(2),,()xxxn的初等解析式表达。

定义2.2.4设X为原始数据序列,D为缓冲算子,当X分

别为增长序列,衰减序列或振荡序列时:

1.若缓冲序列XD比原始序列X的增长速度(或衰减速度)

减缓或振幅减小,则称缓冲算子D为弱化算子。

2.若缓冲序列XD比原始序列X的增长速度(或衰减速度)

加快或振幅增大,则称缓冲算子D为强化算子。

2.3实用缓冲算子的构造

定理2.3.1设原始数据序列((1),(2),,())Xxxxn令缓

冲序列((1),(2),,(XDxdxdxnd

其中

1

()[()(1)()]

1

xkdxkxkxn

nk





;k=1,2,……,n,则当X为

增长序列,衰减序列或振荡序列时,D为弱化算子,并称为平均

弱化缓冲算子(AWBO)

证明:直接利用(),(1,2,)xkdk的定义,可知定理成立。

推论2.3.1对于定理1中定义的弱化算子D,

令2222((1),(2),,())XDXDDxdxdxnd

2

1

()[()(1)()],1,2

1

xkdxkdxkdxndkn

nk





则2D对于增长序列,衰减序列或振荡序列时,皆为二阶弱化算子。

定理2.3.2设原始序列和其缓冲算子序列分别为

((1),(2),,())Xxxxn

((1),(2),,())XDxdxdxnd

其中

(1)(2)(1)()

(),1,2,1

21

xxxkkxk

xkdkn

k





()()xndxn

则当X为增长序列(越来越大),衰减序列或振荡序列时,D为

强化算子。

推论2.3.2设D为定理2中定义的强化算子,令

2222((1),(2),,())XDXDDxdxdxnd,其中

2()()()xndxndxn,

2

(1)(2)(1)()

(),1,2,1

21

xdxdxkdkxkd

xkdkn

k





则2D对于增长序列,衰减序列或振荡序列皆为二阶强化算子。

定理2.3.3原始数据序列和其缓冲算子序列分别为

((1),(2),,())Xxxxn

((1),(2),,())XDxdxdxnd

其中

()(1)(1)()

(),1,2,

()(1)/2

kxkkxknxn

xkdkn

nknk







,则当X为增长

序列,衰减序列或振荡序列时,D为弱化算子,并称D为加权

平均弱化缓冲算子(WAWBO)

定理2.3.4设((1),(2),,())Xxxxn为非负的系统行为

数据序列,令((1),(2),,())XDxdxdxnd

其中11

11()[()(1)()][()],1,2,

n

nknk

ik

xkdxkxkxnxikn

。

则当X为增长序列,衰减序列或振荡序列时,D为弱化缓冲算

子,并称D为几何平均弱化缓冲算子(GAWBO)

定理2.3.5设((1),(2),,())Xxxxn为系统行为数据序

列,各时点的权重向量为

12

(,)

n

,则

((1),(2),,())XDxdxdxnd

其中1

1

()(1)()

(),1,2,kkn

kkn

xkxkxn

xkdkn











。则当XD皆

为弱化缓冲算子,并称D为加权平均弱化缓冲算子(WAWBO)。

定理2.3.6设((1),(2),,())Xxxxn,各时点的权重向

量为

12

(,)

n



>0,

令((1),(2),,())XDxdxdxnd

其中

111

11

()[()(1)()][()],1,2,kknkknkkn

n

ik

xkdxkxkxnxikn







则当XD为弱缓冲算子,并称D为加权几何平均弱化缓冲算子

(WGAWBO)。

定理2.3.7设((1),(2),,())Xxxxn为系统行为数据序

列,令((1),(2),,())XDxdxdxnd

其中2(1)()

(),1,2,

()(1)()

nkxk

xkdkn

xkxkxn







则当X为增长序列,衰减序列或振荡序列时,D为强化缓冲算

子,并称D为平均强化缓冲算子(ASBO)

定理2.3.8设((1),(2),,())Xxxxn为非负的系统行为

数据序列,令((1),(2),,())XDxdxdxnd

其中22

11

11

()()

(),1,2,

[()(1)()][()]

n

nknk

ik

xkxk

xkdkn

xkxkxnxi





则当X为增长序列,衰减序列或振荡序列时,D为强化缓冲算

子,并称D为几何平均强化缓冲算子(GASBO)

以上列举了部分缓冲算子,当然,我们还可以考虑构造其

它形式的实用缓冲算子,缓冲算子不仅可以用于灰色系统建模,

而且还可以用于其它各种模型建模。通常在建模之前根据定性分

析结论对原始数据序列施以缓冲算子,淡化或消除冲击扰动对系

统行为数据序列的影响,往往会收到预期的效果。

[例2.3.1]河南省长葛县乡镇企业产值数据(1983年-1986年)

(10155,12588,23480,35388)X

其增长势头很猛,1983-1986年每年平均递增51.6%,尤其是

1984-1986年,每年平均递增67.7%。因此普遍认为今后不可能

一直保持这么高的发展速度。经过认真分析,大家认识到增长速

度高主要是基数低,而基数低的原因是过去对有利与乡镇企业发

展的政策没有用足,用活,用好。要弱化序列增长趋势,就要将

乡镇企业发展比较有利的现行政策因素附加到过去的年份中去,

为此,引进推论1所示的二阶弱化算子,得二阶缓冲序列

2(27260,29547,32411,35388)XD

用XD2建模预测得,1986-2000年该县乡镇企业每年平均递增

9.4%,这一结果是1987年得到的,与“八五”后半期和“九五”

期间该县乡镇企业发展实际基本吻合。

2.4均值生成算子

在收集数据时,常常由于一些不易克服的困难导致数据序列

出现空缺(也称空穴),有些数据序列虽然完整,但由于系统行

为在某个时点上发生突变而形成异常数据,剔除异常数据就会留

下空穴,如何填补空穴,自然成为数据处理过程中首先遇到的问

题,均值生成是常用的构造新数据,填补原序列空穴,生成新序

列的方法。

定义2.4.1设序列X在k出现有空穴,记为()k,即

((1),(2),,(1),(),(1),,())Xxxxkkxkxn

则称(1)(1)()(1)(1)xkxkkxkxk和为的界值,为前界,为后界

()(1)(1)(1)(1)]kxkxkxkxk当是由和生成时,称生成值x(k)为[,的内点

定义2.4.2设序列

((1),(2),,(1),(),(1),,())Xxxxkkxkxn

为k处有空穴()k的序列,而()k*=()0.5(1)0.5()xkxkxk称为非

紧邻均值生成数,所得序列称为非紧邻生成序列。

定义2.4.3设序列((1),(2),,())Xxxxn,若

*()0.5(1)0.5()xkxkxk,则称*()xk为紧邻生成数,由紧邻生

成数构成的序列称为紧邻均值生成序列。

2.5序列的光滑性

定义2.5.1设序列((1),(2),,(),(1))Xxxxnxn,Z

是X的均值生成序列:

((1),(2),,())Zzzzn,其中()0.5(1)0.5()zkxkxk,

X*是某一可导函数的代表序列,d为n维空间的距离函数,我们

将X删去(1)xn后所得的序列仍记X,若X满足

1.当k充分大时,1

1

()()

k

i

xkxi



2.**

11

max()()max()()

knkn

xkxkxkzk





则称X为光滑序列,1,2为序列光滑条件。

定义2.5.2称

1

1

()

();2,3,

()

k

i

xk

kkn

xi



为序列X的光滑比。

定义2.5.3若序列X满足

1.

(1)

1;2,3,1

()

k

kn

k



2.()[0,];3,4,kkn

3.0.5

则称X为准光滑序列。

2.6级比生成算子

定义2.6.1设序列((1),(2),,())Xxxxn,则称

()

();2,3,

(1)

xk

kkn

xk



为序列X的级比。

2.7累计生成算子与累减生成算子

累加生成是使灰色过程由灰变白的一种方法,它在灰色系统

理论中占有极其重要的地位。通过累加可以看出灰量积累过程的

发展态势,使离乱的原始数据中蕴含的积分特性或规律充分显露

出来。

定义2.7.1设0000((1),(2),,())Xxxxn,D为序列算子

0000((1),(2),,())XDxdxdxnd,其中

00

1

()();1,2,3,,

k

i

xkdxikn

。

则称D为0X的一次累加生成算子,记为1-AGO(Accumulating

GenerationOperator),称r阶算子rD为0X的r次累加生成算子,

记为r-AGO,习惯上,我们记

01111((1),(2),,())XDXxxxn

0((1),(2),,())rrrrrXDXxxxn

其中1

1

()();1,2,3,,

k

rr

i

xkdxikn



定义2.7.2(累减)设0000((1),(2),,())Xxxxn,D为序列

算0000((1),(2),,())XDxdxdxnd,其中

000()()(1)1,2,3,,xkdxkxkkn

2.8灰指数律

定义2.8.1设序列((1),(2),,())Xxxxn,若对于

1.();,0;1,2akxkcecakn则称X为齐次指数序列。

2.();,,0;1,2akxkcecabkn,称X为齐次指数序列。

定义2.8.2设序列((1),(2),,())Xxxxn若

1.

()

,()(0,1]

(1)

xk

kk

xk



,则称序列X具有负的灰指数规

律。

2.

()

,()(1,]

(1)

xk

kkb

xk



,则称序列X具有正的灰指数规

律。

3.

()

,()[,],

(1)

xk

kkabba

xk



则称序列X具有绝对灰度

为的灰指数规律。

4.0.5时,称X具有准指数规律。

定理2.8.1设序列0000((1),(2),,())Xxxxn为非负准光滑序

列,则0X的一次累加生成序列1X具有准指数规律。

注:定理2.8.1是灰色系统建模的理论基础

第三章灰色关联分析

对两个系统或两个因素之间关联性大小的量度,称为

关联度。它描述系统发展过程中因素间相对变化的情况,也就是

变化大小、方向及速度等指标的相对性。如果两者在系统发展过

程中相对变化基本一致,则认为两者关联度大;反之,两者关联

度就小。灰色系统理论的关联度分析与数理统计学的相关分析是

不同的,两者的区别在于第一,它们的理论基础不同。关联度分

析基于灰色系统的灰色过程,而相关分析则基于概率论的随机过

程;第二,分析方法不同。关联分析是进行因素间时间序列的比

较,而相关分析是因素间数组的比较;第三,数据量要求不同。

关联分析不要求数据太多,而相关分析则需有足够的数据量;第

四,研究重点不同。关联度分析主要研究动态过程,而相关分析

则以静态研究为主。因此,关联度分析适应性更广,在用于社

会经济系统中的应用更有其独到之处。

一般的抽象系统,如社会系统,经济系统,农业系统,生态系统

等都包含有许多种因素,多种因素共同作用的结果决定了该系统

的发展态势。我们常常希望知道众多的因素中,哪些是主要因素,

哪些是次要因素,哪些因素对系统发展影响大,哪些因素对系统

发展影响小,哪些因素对系统发展起推动作用需加强,哪些因素

对系统发展起阻碍作用需抑制……

数理统计中的回归分析,方差分析,主成分分析等都是用来

进行系统特征分析的方法。但数理统计中的分析方法往往需要大

量数据样本,且服从某个典型分布。灰色关联分析方法弥补了采

用数理统计方法作系统分析所导致的缺憾.它对样本量的多少和

样本有无规律都同样适用,而且计算量小,十分方便,更不会出现

量化结果与定性分析结果不符的情况。

灰色关联分析的基本思想是根据序列曲线几何形状的相似

程度来判断其联系是否紧密。曲线越接近,相应序列之间关联度

就越大,反之就越小。例如某地区农业总产值

0

X,种植业总产值

1

X,畜牧业总产值

2

X和林业总产值

3

X,从1997-2002年共6年的

统计数据如下:

0

X(18,20,22,35,41,46)

1

X(8,11,12,17,24,29)

2

X(3,2,7,4,11,6)

0

X(5,7,7,11,5,10)

产值散点图

0

10

20

30

40

50

92

年份

农业

种植业

畜牧业

林果业

从直观上看,与农业总产值曲线最相似的是种植业总产值曲

线,而畜牧业总产值曲线和林果业总产值去与农业总产值曲线在

几何形状上差别较大。因此我们可以说该地区的农业仍然是以种

植业为主的农业,畜牧业和林果业还不够发达。

3.1灰色关联因素和关联算子集

进行系统分析,选准系统行为特征的映射量后,还需进一

步明确影响系统行为的有效因素。如要作量化研究分析,则需要

对系统行为特征映射量和各有效因素进行处理,通过算子作用,

使之化为数量级大体相近的无量纲数据,并将负相关因素转化为

正相关因素。

定义3.1.1设((1),(2),,())

iiii

Xxxxn为因素

i

X的行为

序列,

1

D为序列算子,且

1111

((1),(2),,())

iiii

XDxdxdxnd

其中

1

()

()(1)0;1,2

(1)

i

ii

i

xk

xkdxkn

x

,则称

1

D为

初值化算子。

1i

XD为

i

X在初值化算子

1

D的象,简称初值象。

定义3.1.2设((1),(2),,())

iiii

Xxxxn为因素

i

X的行为

序列,

2

D为序列算子,且

2222

((1),(2),,())

iiii

XDxdxdxnd

其中

2

1

()

();1,2

1

()

i

i

n

i

k

xk

xkdkn

xk

n



,则称

2

D为均

值化算子。

2i

XD为

i

X在均值化算子

2

D的象,简称均值象。

定义3.1.3设((1),(2),,())

iiii

Xxxxn为因素

i

X的行为

序列,

3

D为序列算子,且

3333

((1),(2),,())

iiii

XDxdxdxnd

其中

3

()min()

();1,2

max()min()

ii

k

i

ii

k

k

xkxk

xkdkn

xkxk



则称

3

D为区间化算子。

3i

XD为

i

X在区间化算子

3

D的象,简称区间

值象。

命题4.1.1初值化算子、均值化算子和区间值化算子皆可以使系

统行为序列无量纲化,且在数量上规一。一般地,

不宜混合、重叠使用。

定义3.1.4设((1),(2),,())

iiii

Xxxxn,()[0,1]xk为因

i

X的行为序列,

4

D为序列算子,且

4444

((1),(2),,())

iiii

XDxdxdxnd

其中

4

()1();1,2

ii

xkdxkkn,则称

4

D为逆化

算子。

4i

XD为

i

X在逆化算子

4

D的象,简称逆化象。

定义3.1.5设((1),(2),,())

iiii

Xxxxn,()[0,1]xk为因

i

X的行为序列,

5

D为序列算子,且

5555

((1),(2),,())

iiii

XDxdxdxnd

其中

5

1

()()0;1,2

()ii

i

xkdxkkn

xk

,则称

5

D为倒数算子。

5i

XD为

i

X在倒数化算子

5

D的象,简称倒数化象。

命题4.1.3若系统因素((1),(2),,())

iiii

Xxxxn与系统主行

为呈负相关关系,则((1),(2),,())

iiii

Xxxxn的逆化算子作

用像和倒数化作用像与X

0

具有正相关关系。

定义3.1.6称{|1,2,3,4,5}

i

DDi为灰色关联算子集(以上五

个)。

定义3.1.7设X为系统因素集合,D为灰色关联算子集,称

(X,D)为灰色关联因子空间。

3.2灰色关联公理与灰色关联度

灰色系统理论提出了一种新的分析方法—关联度分析方法,

即根据因素之间发展态势的相似或相异程度来衡量因素间关联

的程度,它揭示了事物动态关联的特征与程度。由于以发展态势

为立足点,因此对样本量的多少没有过分的要求,也不需要典型

的分布规律,计算量少到甚至可用手算,且不致出现关联度的量

化结果与定性分析不一致的情况。这种方法已应用到农业经济、

水利、宏观经济等各方面,都取得了较好的效果。

灰色系统理论建模的主要任务是根据具体灰色系统的行为

特征数据,充分开发并利用不多的数据中的显信息和隐信息,寻

找因素间或因素本身的数学关系。通常的办法是采用离散模型,

建立一个按时间作逐段分析的模型。但是,离散模型只能对客观

系统的发展做短期分析,适应不了从现在起做较长远的分析、规

划、决策的要求。尽管连续系统的离散近似模型对许多工程应用

来讲是有用的,但在某些研究领域中,人们却常常希望使用微分

方程模型。事实上,微分方程的系统描述了我们所希望辨识的系

统内部的物理或化学过程的本质。

大千世界里的客观事物往往现象复杂,因素繁多。我们往往

需要对系统进行因素分析,这些因素中哪些对系统来讲是主要

的,哪些是次要的,哪些需要发展,哪些需要抑制,哪些是潜在

的,哪些是明显的。一般来讲,这些都是我们极为关心的问题。

事实上,因素间关联性如何、关联程度如何量化等问题是系统分

析的关键和起点。

对于两系统之间的因素,其随时间或不同对象而变化的关联性的

大小的量度,称为关联度。在系统发展过程中,若两个因素变化

的趋势具有一致性,即变化程度较高,即可谓二者的关联度较高;

反之,则较低。因此,灰色关联度分析方法,是根据因素之间发

展趋势的相似或相异程度,即“灰色关联度”作为衡量因素之间

关联程度的一种方法。灰色系统理论提出了对各子系统进行灰色

关联度分析的概念,意图透过一定方法,去寻求系统各子系统(或

因素)之间数值的关系。因此,灰色关联度分析对于一个系统的

发展变化态势提供了量化的度量,非常适合动态历程分析。

关联分析实际上是动态过程发展态势的量化比较分析。

所谓发展态势比较,也就是系统各时期有关统计数据的几何关系

的比较。

例如,某地区1977~1983年总收入与养猪、养兔收入资料见表

1。

定义3.2.1(灰色关联公理)

0000

((1),(2),,())Xxxxn为系统特征序列,且

1111

((1),(2),,())Xxxxn

……………………………………

((1),(2),,())

iiii

Xxxxn

……………………………………

((1),(2),,())

mmmm

Xxxxn

为相关因素序列,给定实数

0

((),())

i

rxkxk,若实数

00

1

1

(,)((),())

n

ii

k

rXXrxkxk

n

,满足

1.规范性

000

0(,)1,(,)1

iii

rXXrXXXX

2.整体性对于,|0,1,,;2

ijS

XXXXsmm有

(,)(,)

ijji

rXXrXXij

3.偶对对称性,

ij

XXX,有

(,)(,){,}

ijjiij

rXXrXXXXX

4.接近性

0

|()()|

i

xkxk越小,

0

((),())

i

rxkxk越大。

则称

00

1

1

(,)((),())

n

ii

k

rXXrxkxk

n

为,

ij

XXX的灰色关联度,其中

0

((),())

i

rxkxk为

ij

XX和在k点的关联系数,并称条件1.2.3.4为灰色

关联四公理。

在灰色关联公理中,规范性

0

0(,)1

i

rXX表明系统中任何两

个行为序列都不可能严格无关联。

整体性则体现了环境对灰色关联比较的影响,环境不同,灰

色关联度也随之变化,因此对称性不一定满足。

偶对对称性表明,当灰色关联因子集中只有两个序列时,满

足对称性。

接近性是对关联量化的约束。

定义3.2.2设系统行为序列

0000

((1),(2),,())Xxxxn

1111

((1),(2),,())Xxxxn

……………………………………

((1),(2),,())

iiii

Xxxxn

……………………………………

((1),(2),,())

mmmm

Xxxxn

对于(0,1)令

00

0

00

minmin()()maxmax()()

((),())

()()maxmax()()

ii

ik

ik

i

ii

ik

xkxkxkxk

rxkxk

xkxkxkxk





0

((),())

i

rxkxk为

0

()

i

rk,

000

11

11

(,)((),())()

nn

iii

kk

rXXrxkxkrk

nn



,则

00

1

1

(,)((),())

n

ii

k

rXXrxkxk

n

满足灰色关联公理,其中称为分辨系

数。

0

(,)

i

rXX称为

0

,

i

XX的灰色关联度,记为

0i

r

根据关联度的定义,可得关联度的计算步骤如下:

1.根据评价目的确定评价指标体系,收集评价数据

设m个数据序列形成如下矩阵:









01

01

01

01

111

222

,,

m

m

m

m

xxx

xxx

XXX

xnxnxn















其中

n

为指标的个数,

1,2,,,1,2,,T

iiii

Xxxxnim

m是比较数列,n是数据指标,

0

X是参考数据列

2.确定参考数据列

0

X

参考数据列应该是一个理想的比较标准,可以以各指标的

最优值(或最劣值)构成参考数据列,也可根据评价目的选择

其它参照值.记作

0000

(1),2,,Xxxxm

3.对指标数据序列用关联算子进行无量纲化(目的是消除

数量级大小不同的影响,以便于进行计算和比较分析),无量纲

化后的数据序列形成如下矩阵:









01

01

01

01

111

222

,,,

m

m

m

m

xxx

xxx

XXX

xnxnxn

























常用的无量纲化方法有均值化像法、初值化像法等.













1

,

1

1

0,1,,1,2,,.

ii

ii

n

i

i

k

xkxk

xkxk

x

xk

n

imkn







由于系统中各因素的量纲(或单位)不一定相同,如劳动力为人,

产值为万元,产量为吨等,且有时数值的数量级相差悬殊,如人

均收入为几百元,粮食每公顷产量为几千公斤,费用为几十万元,

有些产业产值达百亿元,有些产业才几万元,等等,这样的数据

很难直接进行比较,且它们的几何曲线比例也不同。因此,对原

始数据需要消除量纲(或单位),转换为可比较的数据序列。目前,

原始数据的变换有以下几种常用方法:

a)均值化变换。先分别求出各个序列的平均值,再用平均值去

除对应序列中的各个原始数据,所得到新的数据列,即为均值化

序列。其特点是量纲为一,其值大于0,并且大部分近于1,数

列曲线互相相交。

b)初值化变换。分别用同一序列的第一个数据去除后面的各

个原始数据,得到新的倍数数列,即为初值化数列。量纲为一,

各值均大于0,且数列有共同的起点。

c)标准化变换。先分别求出各个序列的平均值和标准差,然后

将各个原始数据减去平均值后再除以标准差,这样得到的新数据

序列即为标准化序列。量纲为一,其均值为0,方差为1。

一般情况下,对于较稳定的社会经济系统数列作动态

序列的关联度分析时,多采用初值化变换,因为这样的数列多数

是增长的趋势。若对原始数列只作数值间的关联比较,可用均值

化变换,譬如进行产业结构变化的关联分析,自然因素周期性变

化的关联分析等。

补充

4.逐个计算每个被评价对象指标序列与参考序列对应元素

的绝对差值

0

()()()

ii

kxkxk





1,,kn

1,,im

5.确定0

11

minmin()()

nm

i

ik

Mxkxk







0

11

maxmax()()

nm

i

ik

mxkxk







6.计算关联系数

分别计算每个比较序列与参考序列对应元素的关联系数

0

((),())

()i

i

mM

rxkxk

kM







1,,kn

式中为分辨系数,在(0,1)内取值,越小,关联系数间的

差异越大,区分能力越强.通常取0.5.

称为分辨系数,其意义是削弱最大绝对差数值太大引起的失

真,提高关联系数之间的差异显著性,(0,1),一般情况下可

取0.1~0.5。

关联系数反映两个被比较序列在某一时刻的紧密(靠近)程

度。如在

min

的时刻,L

io

=1,而在

max

的时刻则关联系数为最

小值。因此,关联系数的范围为0

7.计算关联度

00

1

1

(,)()

n

ii

k

rXXrk

n



由以上所述可知,关联度分析实质上是对时间序列数据进行几何

关系比较,若两序列在各个时刻点都重合在一起,即关联系数均

等于1,则两序列的关联度也必等于1。另一方面,两比较序列

在任何时刻也不可垂直,所以关联系数均大于0,故关联度也都

大于0。因此,两序列的关联度便以两比较序列各个时刻的关联

系数之平均值计算,即:

00

1

1

(,)()

n

ii

k

rXXrk

n



式中r

0i

为子序列i与母序列0的关联度,N为比较序列的长度(即

数据个数)。

用几何坐标表示,即在横坐标为时间t、纵坐标为关联系数L

的坐标图中,绘出关联系数曲线(虚线)。该折线与横坐标间围成

的面积,称为关联面积,记作S

0i

,而母序列自身的关联系数处

处为1。所以,取纵坐标L=1,作水平线与横坐标间围成的面积

为重合面积,记为S

00

,则关联度的几何意义为两面积之比,即

r

S

Si

i

0

0

00

。因关联系数曲线为等时距,且S

00

=1,故

rS

N

Lk

iioi

k

N

00

1

1



()

8.依据各观察对象的关联

序,得出综合评价结果.

不难看出,关联度与下列

因素有关:

1)母序列X

0

不同,则关联度不同;

2)子序列X

i

不同,则关联度不同;

3)参考点0(或数据变换)不同,关联度不同;

4)数据序列长度N不同,关联度不同;

5)分辨系数不同,关联度不同。

一般来说,关联度也满足等价“关系”三公理,即:1)自

反性:r

00

=1;2)对称性:r

0i

=r

i0

;3)传递性:r

0a

>r

0b

,r

0b

>r

0c

则r

0a

>r

0c

将m个子序列对同一母序列的关联度按大小顺序排列起

来,便组成关联序,记为{X}。它直接反映各个子序列对于母序

列的“优劣”关系。若r

0a

>r

0b

,则称{X

a

}对于相同母序列{X

0

}

有优于{X

b

}的特点,记为{|}{|}XXXX

ab00

;若r

0a

0b

,则称{X

a

}

对于母序列{X

0

}劣于{X

b

},记为{|}{|}XXXX

ab00

;若r

0a

=r

0b

,则称

{X

a

}对于母序列{X

o

}等价于(或等于){X

b

},记为{X

a

│X

0

}~{X

b

│X

0

};若有r

0a

r

0b

,称{X

a

}对于母序列{X

o

}优于或等于{X

b

},

记为{|}{|}

~

XXXX

ab00

;若有r

0a

r

0b

,则称{X

a

}对于母序列{X

o

}劣

于或等于{X

b

},记为{|}{|}

~

XXXX

ab00

。

根据上述几种关系,可定义两种有代表性的关联序,即“有

序”与“偏序”。若关联序{X}为有序,那么所有元素之间必存在

以下几种关系之一:“优于”(),“劣于”(),或“等价于”

(~)。若关联序{X}为偏序,则不是所有元素都可比较的。

一般而言,各因素只要能构成关系,算出关联度,则总是

“有序”的。只有在无“参考点”或无参考母序列的情况下,

才可能出现“偏序”现象。

3.3灰色关联分析的应用举例

1、利用灰色关联分析对6位教师工作状况进行综合评价

1.评价指标包括:专业素质、外语水平、教学工作量、科

研成果、论文、著作与出勤.

2.对原始数据经处理后得到以下数值,见下表

教师考评数据表

编号专业外语

教学

科研论文著作出勤

X09999899

1

X8987529

2

X7875738

3

X9796647

4

X6888436

5

X8669838

6

X8957648

3.确定参考数据列:



0

9,9,9,9,8,9,9X

4.计算0

()()()

ii

kxkxk





,见下表

编号专业外语

教学

科研论文著作出勤

1

i

2

i

3

i

4

i

5

i

6

i

7

i

10

XX1012470

20

XX2124261

30

XX0203352

40

XX3111563

50

XX1330161

60

XX1042351

5.0

11

minmin()()min(0,1,0,1,0,0)0

nm

i

ik

xkxk





0

11

maxmax()()max(7,6,5,6,6,5)7

nm

i

ik

xkxk





6.依据式0

((),())

()i

i

mM

rxkxk

kM







,取0.5计算,

01

00.57

(1)0.778

10.57

r





01

00.57

(2)1.000

00.57

r







01

(3)0.778r

01

(4)0.636r

01

(5)0.467r

01

(6)0.333r

01

(7)1.000r

同理得出其它各值,见表(12—5)

编号i0

(1)

i

r

0

(2)

i

r

0

(3)

i

r

0

(4)

i

r

0

(5)

i

r

0

(6)

i

r

0

(7)

i

r

10.7781.0000.7780.6360.4670.3331.000

20.6360.7780.6360.4670.6360.3680.778

31.0000.6361.0000.5380.5380.4120.636

40.5380.7780.7780.7780.4120.3680.538

50.7780.5380.5381.0000.7780.3680.778

60.7781.0000.4670.6360.5380.4120.778

7.分别计算每个人各指标关联系数的均值(关联度):

713.0

7

000.1333.0467.0636.0778.0000.1778.0

01



r

同理

0.6140.6800.5990.6830.658rrrrr,,,,

8.如果不考虑各指标权重(认为各指标同等重要),六个

被评价对象由好到劣依次为1号(713.0

01

r),5号(683.0

05

r),

3号(680.0

03

r),6号(658.0

06

r),2号(614.0

02

r),4号

(599.0

04

r).即

rrrrrr

Matlab程序:

clc;clear;

formatshortg

A=[8987529

7875738

9796647

6888436

8669838

8957648

];%已经处理后的数据

x0=[9999899];

fori=1:size(A,1)

forj=1:size(A,2)

t(i,j)=abs(A(i,j)-x0(j));

end

end

Min=min(min(t));Max=max(max(t));

rho=0.5;

r=(Min+rho*Max)./(t+rho*Max);

rend=sum(r')/size(r,2);

[rs,rind]=sort(rend,'descend')

2、补例

3、补例

年份能源总

产量x0

原煤

x1

天然气水核风电

2000135048

98855.1

36

23228.

256

3646.29

69318.312

2001143875

105028.

75

23451.

6254028.511366.125

2002150656

110732.

16

23803.

648

4369.02

411751.168

2992.24238.4641.4612033.42

3727462

2004196648

151615.

608

25170.

944

5506.14

414355.304

2005216219

167785.

944

25946.

286486.5716000.206

2006232167

180625.

926

26234.

871

7893.67

817412.525

2007247279

192135.

783

26706.

132

9149.32

319287.762

2008

260578.

055

200103.

936

27357.

96

10656.5

76822459.582

2009274618

212279.

714

27187.

182

11259.3

3823891.766

建模步一:数据处理(可以不用无量纲化)

0

1

2

3

4

(){135048,143875,...,274618}

(){98855.136,105028.75,...,212279.714}

(){23228.256,23451.625,...,27187.182}

(){3646.296,4028.5,...,11259.338}

(){9318.312,11366.125,...,23891.766}

xk

xk

xk

xk

xk

步二:计算关联度。经计算

0

minmin()()

i

xkxk36192.864

0

maxmax()()

i

xkxk263358.662

00

00

minmin()()maxmax()()

()

()()maxmax()()

ii

i

ii

xkxkxkxk

k

xkxkxkxk





=

0

36192.864131679.331

()()131679.331

i

xkxk



设分辨系数为0.5

将相应

0

()xk与()

i

xk的数值代入式minmax

max

()

i

k





中,得

1

(1,09844,0.9783,

0.973,0.95,0.932,0.916,0.899,0.874,0.865)

2

(0.689,0.666,0.649,0.601,0.554,0.521,0.497,0.477,

0.46,0.443)

3

(0.638,0.618,0.604,0.562,0.52,0.492,0.472,0.454,

0.44,0.425)

4

(0.652,0.635,0.62,0.576,0.535,0.506,0.485,0.467,

0.454,0.439)

步三:算出关联度

0

,

i

Rxx,由公式10

1

1

()

ii

i

Rk

n

分别计算出原煤、

原油、天然气及水核风电关于能源总产量的关联度

1,2,34

,RRRR。

10

101

1

1

,()

10i

i

RRxxk

0.9371

10

202

1

1

,()

10i

i

RRxxk

0.5557

10

303

1

1

,()

10i

i

RRxxk

0.5224

10

404

1

1

,()

i

i

RRxxk

n

0.5369

步四:比较关联度大小得出结论。由

1

R>

2

R>

4

R>

3

R说明原煤与能

源总量关系最密切,而原油、水核风电和天然气的密切程度依次

较差。

4、

5、

Matlab程序

functionoutput=grayrela(x0)

%参考因子与比较因子共同存储在一个矩阵x0中,参考因子

位于第一列

%斜率序列

fori=2:length(x0(:,1))

x1(i,:)=x0(i,:)-x0(i-1,:);

end

%标准化

m=length(x1(1,:));

fori=1:m

x2(:,i)=x1(:,i)/std(x1(:,i));

end

%排序

[y,pos]=sort(x2(:,1));

x2_sorted=x2(pos,:);

%判定关联性质

n=length(x1(:,1));

k=[1:n]';

forj=1:m

sig_j(j)=qiuhe(k.*x2_sorted(:,j))-qiuhe(x2_sorted(:,j))*qiuhe(k)

/n;

end

%caculationofdistantion

forj=2:m

dist_0i(:,j)=abs(sign(sig_j(:,j)./sig_j(:,1)).*x2_sorted(:,j)-x2_sorted(:,

1));

end

%计算关联系数

fori=1:n

forj=1:m

coef_rela(i,j)=(min(dist_0i)+0.5*max(dist_0i))/(dist_0i(i,j)+0.5*max

(dist_0i));

end

end

forj=1:m

output(j)=qiuhe(coef_rela(:,j))/n;

end

其中:

functionoutput=qiuhe(input)

output=0;

fori=1:length(input)

output=output+input(i);

end

3.4广义灰色关联度

命题3.4.1设

0

X

000

(x(1),x(2),,x(n))

i

X

iii

(x(1),x(2),,x(n)),而

0

0

X000

000

(x(1),x(2),,x(n))和0

i

X000

iii

(x(1),x(2),,x(n))

分别为

0

X与

i

X的始点化像,即0

000

x(k)=x(k)-x(1),0

iii

x(k)=x(k)-x(1),

则记1

0

2

||||

n

k

s

00

00

1

x(k)+x(n)

2

,1

2

||||

n

i

k

s

00

ii

1

x(k)+x(n)

2

1

0

2

||||

n

i

k

ss

0000

i0i0

1

(x(k)-x(k))+(x(n)-x(n))

2

定义3.4.1设序列,

0

s,

i

s如命题3.4.1中所示,则称

0

0

00

1||||

1||||||

i

i

ii

ss

ssss





0

X与

i

X的灰色绝对关联度,简称绝对关联度。绝对关联度满足

灰色关联公理中规范性,偶对对称性与接近性,但不满足整体性。

定理3.4.1灰色绝对关联度

0i

具有如下的性质:

1.

0

01

i



2.

0i

只与

0

X与

i

X几何形状有关,而与其它无关,或者说,

平移不改变绝对关联度的值。

3.任何两个序列都不是绝对无关的,即

0i

恒不为零。

4.

0

X与

i

X几何形状相似程度越大,

0i

越大。

5.当

0

X或

i

X中任一观测数据变化了,

0i

将随之变化。

6.

0

X与

i

X长度变化,

0i

也变化。

7.

00

1

ii



8.

00ii



3.5灰色相对关联度

定义3.5.1设序列

0

X与

i

X长度相同,且初值皆不等于零,

0

X

i

X

分别为

0

X与

i

X的初值像,则称

0

X

与

i

X

的灰色绝对关联度为

0

X与

1

X的灰色相对关联度,简称为相对关联度,记为

0i

R。

相对关联度表征了序列

0

X与

i

X相对与始点的变化速率之间

的关系,

0

X与

i

X的变化速率越接近,

0i

R越大,反之越小。

定理3.5.1设序列

0

X与

i

X长度相同,且初值皆不等于零,若

0i

XcX,其中0c为常数,则

0

1

i

R

定理3.5.2灰色相对关联度

0i

R具有如下的性质:

1.

0

01

i

R

2.

0i

R只与序列

0

X与

i

X的相对于始点的变化率有关,而与各

观测值的大小无关,或者说,数乘不改变相对关联度的值。

3.任何两个序列的变化率都不是毫无联系的,即

0i

R恒不为

零。

4.

0

X与

i

X相当于始点的变化速度越接近,

0i

R越大。

5.当

0

X或

i

X中任一观测数据变化了,

0i

R将随之变化。

6.

0

X与

i

X长度变化,

0i

R也变化。

7.

00

1

ii

RR

8.

00ii

RR

3.6灰色综合关联度

定义3.6.1设序列设序列

0

X与

i

X长度相同,且初值皆不等于

零,

0i

和

0i

R分别为

0

X与

i

X的灰色绝对关联度和相对关联度,

[0,1]则称

000

(1)

iii

R

0

X与

i

X的灰色综合关联度,简称综合关联度。

综合关联度既体现了折线

0

X与

i

X的相似程度,又反映了

0

X与

i

X

相对于始点的变化速率的接近程度,是较为全面的表征序列之间

联系是否紧密的一个数量指标。

例3.6.1河南省长葛县乡镇企业经济的灰色关联分析

20世纪80年代中期,长葛县乡镇企业发展比较快,1983

年到1986年,平均每年增长51.6%,乡镇企业经济在全县经济

发展中占有重要地位,1986全县乡镇企业产值35388万元,占

工农业总产值的60%。如何有效的加快乡镇企业的发展,是大家

普遍关心的问题。据分析,乡镇企业产值主要与固定资产,流动

资产,劳动力,企业留利四个因素有关。该县乡镇企业产值及相

关因素行为数据如下表:

51986

变量

0

X(产值)

10835388

1

X(固定资

产)

379936

2

X(流动资

产)

34753

3

X(劳动

力:人)

241864559

4

X(企业留

利)

44478

单位:万元

1.求绝对关联度。令





0

0000

11,21,31,41

1,2,3,4;0,1,2,3,4

iiiiiiiii

iiii

Xxxxxxxxx

xxxxi





即始点零化

像,则











0

0

0

1

0

2

0

3

0

4

0,2433,13325,25233

0,2433,13325,25233

0,194,1661,3188

0,408,461,3001

0,624,2030,3314

X

X

X

X

X



由3

2

||||;0,1,2,3,4

i

k

si

00

ii

1

x(k)+x(4)

2

01234

28374.5,3058.5,2369.5,85580,4311sssss

由3

0

2

||||;1,2,3,4

i

k

ssi

0000

i0i0

1

(x(k)-x(k))+(x(4)-x(4))

2

10203040

||25316,||26005,||57205,||24063.5ssssssss

由0

0

00

1||||

1||||||

i

i

ii

ss

ssss





;1,2,3,4i得

01020304

0.554,0.542,0.666,0.576

2.求相对关联度。先求出

i

X的初值像,由



















1234

1,234,,,

1111

0,1,2,3,4

iiii

iiiii

iiii

xxxx

Xxxxx

xxxx

i













得

0

1,1.2396,2.3051,3.4848X









1

2

3

4

1,0.9489,1.4372,1.8379

1,1.2329,1.2631,2.7129

1,1.8550,2.3851,3.5368

1,1.5361,2.6924,3.8471

X

X

X

X

i

X

的始点零化像为





0

0000

11,21,31,41

1,2,3,4;0,1,2,3,4

iiiiiiiii

iiii

Xxxxxxxxx

xxxxi











从而有











0

0

0

1

0

2

0

3

0

4

0,0.2396,1.3051,2.4848

0,0.0511,0.4372,0.8379

0,0.2329,0.2631,1.7129

0,0.8850,1.3851,2.5368

0,0.5361,1.6924,2.8471

X

X

X

X

X



由3

2

||||;0,1,2,3,4

i

k

si



00

ii

1

x(k)+x(4)

2

01234

2.7871,0.80505,1.35245,3.5385,3.65205sssss





由3

0

2

||||;1,2,3,4

i

k

ssi



0000

i0i0

1

(x(k)-x(k))+(x(4)-x(4))

2

10203040

||1.98205,||0.43465,||0.7514,||0.86495ssssssss





由0

0

00

1||||

1||||||

i

i

ii

ss

r

ssss









;1,2,3,4i得

01020304

0.6985,0.7818,0.9070,0.8958rrrr

3.求综合关联度。取0.5,由综合关联度

000

(1)

iii

R得

01020304

0.6263,0.6619,0.7865,0.7359

4.结果分析。由

03040201

得知

相对

0

X来说,

3

X为最优因素,

4

X次之,

2

X又次之,

1

X最差。也

就是说,劳动力对乡镇企业的产值影响最大,企业留利对产值的

影响仅次于劳动力,固定资产对产值的影响最小。这一结果与该

县的实际情况吻合。这个县的乡镇企业主要是劳动密集型产业,

产值的增长在很大程度上是靠增加劳动力来实现的。

第四章灰色系统模型

研究一个系统,一般应首先建立系统的数学模型,进而对系

统的整体功能,协调功能以及系统各因素之间的关联关系,因果

关系进行具体的量化研究。这种研究必须以定性分析为先导,定

量与定性紧密结合,系统模型的建立,一般要经过思想开发,因

素分析,量化,动态化,优化五个步骤。即语言模型,网络模型,

量化模型,动态模型,优化模型。

在建模过程中,要不断的将下一阶段中所得的结果回馈,经

过多次循环往返,使整个模型逐步趋于完善。

灰色预测方法的特点表现在:首先是它把离散数据视为连续

变量在其变化过程中所取的离散值,从而可利用微分方程式处理

数据;而不直接使用原始数据而是由它产生累加生成数,对生成

数列使用微分方程模型。这样,可以抵消大部分随机误差,显示

出规律性。

灰色系统理论的建模思想

下面举一个例子,说明灰色理论的建模思想。考虑4个数据,

记为)4(),3(),2(),1()0()0()0()0(XXXX,其数据见下表:

序号1234

符号)1()0(X)2()0(X)3()0(X)4()0(X

数据121.54

将上表数据作图得

0

1

2

3

4

5

1234

X

Y

上图表明原始数据)0(X没有明显的规律性,其发展态势是摆

动的。如果将原始数据作累加生成1-AGO,记第K个累加生成

为)()1(KX,并且

1)1()1()0()1(XX

321)2()1()2()0()0()1(XXX

5.45.121)3()2()1()3()0()0()0()1(XXXX

5.735.121)4()3()2()1()4()0()0()0()0()1(XXXXX

得到数据如下表所示

序号1234

符号)1()1(X)2()1(X)3()1(X)4()1(X

数据134.57.5

0

1

2

3

4

5

6

7

8

1234

X

Y

上图表明生成数列X是单调递增数列。

4.1GM(1,1)模型

灰色系统理论的微分方程成为Gm模型,G表示gray(灰色),

m表示model(模型),Gm(1,1)表示1阶的、1个变量的微分

方程模型。

定义4.1.1设

0000

((1),(2),,())Xxxxn

1111

((1),(2),,())Xxxxn,则称

01

()()xkaxkb

为GM(1,1)模型的原始形式。

定义4.1.2设

0000

((1),(2),,())Xxxxn,

1111

((1),(2),,())Xxxxn,

1111

((2),(3),,())Zzzzn

其中

111

1

()(()(1))1,2,

2

zkxkxkkn

则称

01

()()xkazkb为GM(1,1)模型的基本形式。

定义4.1.3设

0

X为非负序列:

0000

((1),(2),,())Xxxxn

1

X为

0

X的1-AGO(即一次累加)序列:

1111

((1),(2),,())Xxxxn,

其中

10

1

()()1,2,

k

i

xkxikn

;;

1

Z为

1

X的紧邻均值生成序列

1111

((2),(3),,())Zzzzn,

其中

111

1

()(()(1))1,2,

2

zkxkxkkn

若[,]Taab

为参数列,且

0

1

0

1

0

1

(2)

(2)1

(3)

(3)1

,

()

()1

x

Z

x

Z

YB

xn

Zn



























则GM(1,1)模型

01

()()xkazkb的最小二乘估计参数列满足

1[,]()TTTaabBBBY



定义4.1.4设

0

X为非负序列,

1

X为

0

X的1-AGO(即一次累加)

序列,

1

Z为

1

X的紧邻均值生成序列,则称1

1

dx

axb

dt



为GM(1,1)模型

01

()()xkazkb

的白化方程,也叫影子方

程。

定理4.1.1设,,BYa

如定理4.13所述,

1[,]()TTTaabBBBY

,则

1.白化方程1

1

dx

axb

dt

的解(也称时间响应函数)为



11

()(1)at

bb

xtxe

aa



2.GM(1,1)模型

01

()()xkazkb

的时间响应函数序列为



10

(1)(1)1,2,,ak

bb

xkxekn

aa



3.还原值



0111

1

0

(1)(1)(1)()

11;1,2,,aak

xkxkxkxk

b

exekn

a















0

11;1,2,,aak

b

exekn

a









定义4.1.5称GM(1,1)模型中的参数a为发展系数,b为灰

色作用量。

a反映了

1

x

与

0

x

的发展态势。一般情况下,系统作用量应

是外生的或者前定的,而GM(1,1)是单序列建模,只用到系统的

行为序列(或称输出序列,背景值),而无外生作用序列(或称

输入序列,驱动量)。GM(1,1)模型中的灰色作用量b是从背景值

挖掘出来的数据,它反映数据变化的关系,其确定内涵是灰色的,

灰色作用量是内涵外延化的具体表现,它的存在,是区别灰色建

模与一般输入输出建模的分水岭,也是区别灰色系统观点与灰箱

观点的重要标志。

定理4.1.2GM(1,1)模型

01

()()xkazkb

可转化为



01

()1xkxk

,其中,

10.510.5

ba

aa





4.2残差GM(1,1)模型

当GM(1,1)模型的精度不符合要求时,可用残差序列

建立GM(1,1)模型,对原来的模型进行修正,以提高精度。

定义4.2.1设

0

X为原始序列,

1

X为

0

X的1-AGO序列,

GM(1,1)模型的时间响应式

10

(1)(1)1,2,,ak

bb

xkxekn

aa



则称

10

(1)(1)1,2,,ak

b

dxkaxekn

a



为导数还原值。

命题4.2.1设

10

(1)(1)1,2,,ak

b

dxkaxekn

a

为

导数还原值,

0110

(1)(1)()11

1,2,,

aak

b

xkxkxkexe

a

kn











累减还原值,则

10

(1)(1)1,2,,dxkxkkn





由此命题知,GM(1,1)模型既不是微分方程,也不是

差分方程。但当a充分小时,1aea,有

10

(1)(1)dxkxk



。

这说明了微分与差分的结果十分接近,因此GM(1,1)模型

既可以看成微分方程,也可以看成差分方程。

鉴于导数还原值与累减还原值不一致,为减少往返运算造成

的误差,往往用

1

X的残差修正

1

X的模拟值

1

(1)xk

。

定义4.2.2设00001,2,n

其中0

11

kxkxk

为

1

X的残差序列。若存在

0

k,满足

1.

00

,kkk的符号一致。

2.

0

4nk,则称000

00

,1,kkn

为可建模残差尾段,仍记为0000

00

,1,kkn

命题4.2.2设0000

00

,1,kkn为可建模残差

尾段,其1-AGO序列为

1111

00

,1,kkn

的GM(1,1)的时间响应式为

0

1

()

000

(1)()akk

bb

kkekk

aa









则残差尾段0的模拟序列为

0000

00

,1,kkn









其中0

0

()

000

(1)()akk

b

kakekk

a





定义4.2.3若

011

()()(1)1,2,,xkxkxkkn



,则相应的

残差修正时间响应式



0

0

00

()

0000

1(1)

(1)

1(1)()

aak

akk

aak

b

exekk

a

xk

b

b

exeakekk

aa









称为累减还原式的残差修正模型。

定义4.2.4若

00

(1)(1)ak

b

xkaxe

a

,则相应的残差修正

时间响应式



0

0

00

()

0000

(1)

(1)

(1)()

ak

akk

ak

b

axekk

a

xk

b

b

axeakekk

aa









称为导数还原式的残差修正模型。

例4.2.1湖北省云梦县油菜发病率数据为



0

6,20,40,25,40,45,35,21,14,18,15.5,17,15X

建立GM(1,1)模型,得时间响应式为

1

0.064861567.999573.999kxke

作累减还原,得

0

35.6704,33.4303,31.3308,29.3682,27.5192,25.7900,

24.1719,22.6534,21.2307,19.8974,18.6478,17.4768

X







检验其精度:列出误差检验表如下。

序号原始数据



0

xk

模拟数据

0xk

残差

0

0

kxkxk

相对误差





0

k

k

xk



22035.6704-15.670478.3540%

34033.43036.567916.4242%

42531.3308-6.330825.3232%

54029.368210.6318.26.5795%

64527.519217.480838.8642%

73525.79019.209926.3140%

82124.1719-3.171915.1043%

91422.6534-8.653461.8100%

101821.2307-3.230717.9483%

1115.519.8974-4397428.3703%

121718.6478-1.64789.6926%

131517.4768-2.478616.5120%

由表可以看出,模拟误差较大,进一步计算残差平方和

57.18Ts

平均相对误差

13

2

1

30.11%

12k

k



残差平方和很大,相对精度不到70%,需采用残差模型进行修正。

0

9k得残差尾段





000000

9,10,11,12,13

-8.6534,-3.2307,-43974,-1.6478,-2.4786



用此尾段可建立残差尾段模型,取绝对值,得



0

8.6534,3.2307,43974,1.6478,2.4786

建立GM(1,1)模型,得

0

的1-AGO序列

1

的时间响应式



1

0..7kke

其导数还原值为



0

0.1685590.16855910.16885244.0452kkkee

由

011

0.06486

0

(1)(1)()1138.0614aakk

b

xkxkxkexee

a













得累减还原式的残差修正模型为

0

0.06486

0.168559

0.06486

38.0614,9

(1)

38.06144.0452,9

k

k

k

ek

xk

eek







其中,

0

1k的符合与原始残差序列的符合一致。

按此模型,可对9,10,11,12,13k四个模拟值进行修正,修正后

的精度有明显的提高:

计算可得平均相对误差降为13

10

1

4.595%

4k

k



灰色系统模型的检验

定义1.

设原始序列

)(,),2(),1()0()0()0()0(nxxxX

相应的模型模拟序列为

)(

ˆ

,),2(

ˆ

),1(

ˆ

ˆ)0()0()0()0(nxxxX

残差序列

)(),2(),1()0(n

)(

ˆ

)(,),2(

ˆ

)2(),1(

ˆ

)1()0()0()0()0()0()0(nxnxxxxx

相对误差序列



)(

)(

,,

)2(

)2(

,

)1(

)1(

)0()0()0(nx

n

xx



n

k

1



1.对于k<n,称

)(

)(

)0(kx

k

k

为k点模拟相对误差,称

)(

)(

)0(nx

n

n

为滤波相对误差,称



n

k

kn

1

1

为平均模拟相对误差;

2.称1为平均相对精度,

n

1为滤波精度;

3.给定,当,且

n

成立时,称模型为残差合格模

型。

定义2

设)0(X为原始序列,)0(ˆ

X为相应的模拟误差序列,为)0(X与

)0(ˆ

X的绝对关联度,若对于给定的

00

,0,则称模型为关联合

格模型。

定义3

设)0(X为原始序列,)0(ˆ

X为相应的模拟误差序列,)0(为残差

序列。

n

k

kx

n

x

1

)0()(

1

为)0(X的均值,

2

1

)0(2

1

))((

1

xkx

n

s

n

k



为)0(x的方差,

n

k

k

n

1

)(

1

为残差均值,



n

k

k

n

s

1

22

2

))((

1

为残差方差,

1.称

1

2

s

s

c为均方差比值;对于给定的0

0

c,当

0

cc时,称模

型为均方差比合格模型。

2.称

1

6745.0)(skpp为小误差概率,对于给定的0

0

p,当

0

pp时,称模型为小误差概率合格模型。

精度检验等级参照表

指标临

界性

精度等级

相对误差关联度均方差比

小误差概

一级0.010.900.350.95

二级0.050.800.500.80

三级0.100.700.650.70

四级0.200.600.800.60

一般情况下,最常用的是相对误差检验指标。

应用举例

例6-1

设原始序列

)5(),4(),3(),2(),1()0()0()0()0()0()0(xxxxxX

679.3,390.3,337.3,278.3,874.2

建立Gm(1,1)模型,并进行检验。

解:1)对)0(X作1-AGO,得

[D为)0(X的一次累加生成算子,记为1-AGO,Acumulated

GeneratingOperator]

)5(),4(),3(),2(),1()1()1()1()1()1()1(xxxxxX

558.16,579.12,489.9,152.6,874.2

Matlabx0=[2.8743.2783.3373.3903.679];

x1=zeros(size(x0));

x1(1)=x0(1);

fori=2:5

forj=1:i

x1(i)=x1(i)+x0(j);

end

end

2)对)1(X作紧邻均值生成,令

)1(5.0)(5.0)()1()1()1(kxkxkZ

)5(),4(),3(),2(),1()1()1()1()1()1()1(zzzzzZ

718.14,84.11,820.7,513.4,874.2

于是,

1718.14

184.11

1820.7

1513.4

1)5(

1)4(

1)3(

1)2(

)1(

)1(

)1(

)1(

z

z

z

z

B,

679.3

390.3

337.3

278.3

)5(

)4(

)3(

)2(

)0(

)0(

)0(

)0(

x

x

x

x

Y





1718.14

184.11

1820.7

1513.4

1111

718.14184.11820.7513.4

BB

4235.38

235.38221.423





832371.11665542.0

165542.0017318.0

4235.38

235.38221.423

)(

1

1BB



221.423235.38

235.384

969.230

1

221.423235.38

235.384

235.384221.423

1

2





679.3

390.3

337.3

278.3

1111

718.14184.11820.7513.4

832371.11665542.0

165542.0017318.0

)(

ˆ1YBBBa



679.3

390.3

337.3

278.3

604076.10019051.0537833.0085280.1

089344.0028143.0030115.0087386.0

065318.3

037156.0

3)确定模型

065318.3037156.0)1(

)1(

x

dt

dx

及时间响应式

a

b

e

a

b

xkxak))1(()1(

ˆ)0()1(

4986.823728.85037156.0ke

4)求)1(X的模拟值

)5(

ˆ

),4(

ˆ

),3(

ˆ

),2(),1(

ˆ

ˆ)1()1()1()1()1()1(xxxxxX



=(2.8740,6.1058,9.4599,12.9410,16.5538)

5)还原出)0(X的模拟值,由

)(

ˆ

)1(

ˆ

)1(

ˆ)1()1()0(kxkxkx

得)5(

ˆ

),4(

ˆ

),3(

ˆ

),2(

ˆ

),1(

ˆ

ˆ)0()0()0()0()0()0(xxxxxX

=(2.8740,3.2318,3.3541,3.4811,3.6128)

6)误差检验

序号实际数据模拟数据残差相对误差

)()0(kx)(

ˆ)0(kx)(

ˆ

)()()0()0(kxkxk

)(

)(

)0(kx

k

k



23.2783.23180.04621.41%

33.3373.3541-0.01710.51%

43.3903.4811-0.09112.69%

53.6793.61280.06621.80%

残差平方和





)5(

)4(

)3(

)2(

)5()4()3()2(

s





0662.0

0911.0

0171.0

0462.0

0662.00911.00171.00462.0

=0.0151085

平均相对误差

%)80.1%69.2%51.0%41.1(

4

1

4

15

1



k

k

=1.0625%

计算X与X

ˆ的灰色关联度

))1()5((

2

1

)1()((

4

2

xxxkxS

k



=)874.2679.3(

2

1

)874.2390.3()874.2337.3()874.2278.3(

0.40250.5160.4630.404

=1.7855

)1(

ˆ

)5(

ˆ

(

2

1

)1(

ˆ

)(

ˆ

(

ˆ4

2

xxxkxS

k



)874.26128.3(

2

1

)874.24811.3()874.23541.3()874.22318.3(

3694.06071.04801.03578.0

=1.8144





4

2

))1(

ˆ

)5(

ˆ

())1()5((

2

1

))1(

ˆ

)(

ˆ

())1()((

ˆ

k

xxxxxkxxkxSS

)4025.03694.0(

2

1

)516.06071.0()463.04801.0()404.03578.0(

01655.0091.00171.00462.0

=0.04535

64525.4

5999.4

04535.08144.17855.11

8144.17855.11

ˆˆ

1

ˆ

1









SSSS

SS

=0.9902>0.90

精度为一级,可以用

4986.823728.85)1(

ˆ037156.0)1(kekx

)(

ˆ

)1(

ˆ

)1(

ˆ)1()1()0(kxkxkx预测。

Matlabclc;clear;

x0=[2.8743.2783.3373.3903.679];

x1=zeros(size(x0));

x1(1)=x0(1);

fori=2:5

forj=1:i

x1(i)=x1(i)+x0(j);

end

end

%对作紧邻均值生成z1

z1=zeros(size(x1));

z1(1)=x1(1);

fori=2:5

z1(i)=0.5*x1(i)+0.5*x1(i-1);

end

%求参数a

B=[-z1(2:end)',ones(4,1)];

Y=x0(2:end)';

a=inv(B'*B)*B'*Y;

%系数求出,模型确定

%求出时间响应式为

Gx1(k+1)=85.3728*exp(0.03715*k)-82.4986

f=inline('85.3728*exp(0.037156*x)-82.4986');

x=0:4;

Gx1=f(x);

%还原出x0的模拟值

Gx0=zeros(1,5);

Gx0(1)=Gx1(1);

fori=2:5

Gx0(i)=Gx1(i)-Gx1(i-1);

end

%误差检验

e=x0-Gx0;%残差

e=e(2:end);

e1=abs(e./x0(2:end))%相对误差

Ae1=sum(e1)/4%平均相对误差

s=e*e'%残差平方和

%计算X0与Gx0的灰色关联度ee

s=0;

fori=2:4

s=s+abs(x0(i)-x0(1));

end

s=s+abs(0.5*(x0(5)-x0(1)));

Gs=0;

fori=2:4

Gs=Gs+abs(Gx0(i)-Gx0(1));

end

Gs=Gs+abs(0.5*(Gx0(5)-Gx0(1)));

CHA=abs(Gs-s)

ee=(1+abs(s)+abs(Gs))/(1+abs(s)+abs(Gs)+CHA)

例6-2

某大型企业1997-2000年四年产值资料

年份2000

产值(万

元)

27265388

试建立Gm(1,1)模型的白化方程及时间响应式,并对Gm(1,1)

模型进行检验,预测该企业2001-2005年产值。

解:设时间序列为

)4(),3(),2(),1()0()0()0()0()0(xxxxX

=(27260,29547,62411,35388)

)4(),3(),2(),1()1()1()1()1()1(xxxxX

124606,89218,56807,27260

2)对)1(X作紧邻均值生成,令

)1(5.0)(5.0)()1()1()1(kxkxkZ

)4(),3(),2(),1()1()1()1()1()1(zzzzZ

106912,5.73012,5.42033,27260

于是,

1106912

15.73012

15.42033

1)4(

1)3(

1)2(

)1(

)1(

)1(

z

z

z

B,

35388

32411

29547

)4(

)3(

)2(

)0(

)0(

)0(

x

x

x

Y

对参数列],[

ˆ

ba作最小二乘估计,得



28.25790

089995.0

)(

ˆ1YBBBa

设bax

dt

dx

)1(

)1(

由于

28.25790,089995.0ba

可得Gm(1,1)模型的白化方程

28.25790089995.0)1(

)1(

x

dt

dx

其时间响应式为





)(

ˆ

)1(

ˆ

)1(

ˆ

286574313834))1(()1(

ˆ

)1()1()0(

089995.0)0()1(

kxkxkx

e

a

b

e

a

b

xkxkak

由此得模拟序列

)4(

ˆ

),3(

ˆ

),2(

ˆ

),1(

ˆ

ˆ)0()0()0()0()0(xxxxX

=(27260,29553,32336,35381)

检验:

残差序列为

))4(),3(),2(),1(()0()0()0()0()0(

=(0,-6,75,7)



)4(

)4(

,

)3(

)3(

,

)2(

)2(

,

)1(

)1(

)0(

)0(

)0(

)0(

)0(

)0(

)0(

)0(

xxxx



),,,()0002.0,00231.0,0002.0,0(

4321



平均相对误差

01.0%068.000068.0

4

14

1



k

k

模拟误差01.0%02.00002.0

4

,精度一级

计算)0(X与)0(ˆ

X的灰色关联度

))1()4((

2

1

)1()(()0()0(

3

2

)0()0(xxxkxS

k



=11502

)1(

ˆ

)4(

ˆ

(

2

1

)1(

ˆ

)(

ˆ

(

ˆ3

2

xxxkxS

k



=11429.5





3

2

)0()0()0()0()0()0()0()0())1()4(())1(

ˆ

)4(

ˆ

(

2

1

))1()(())1(

ˆ

)(

ˆ

(

ˆ

k

xxxxxkxxkxSS

=72.5

90.0997.0

5.725.

5.

ˆˆ

1

ˆ

1











SSSS

SS

精度为一级

计算均方差比

5.31151)(

4

14

1

)0(

k

kxx

74.3051,25.9313116))((

4

1

1

4

1

2)0(2

1



SxkxS

k

19)(

4

14

1



K

K

66.32,5.1066))((

4

1

2

2

4

1

2

2



skS

k



所以,35.0011.0

74.3051

66.32

1

2

S

S

c,均方差比值为一级

计算小误差概率

40.20586745.0

1

S

12)4(,56)3(

25)2(,19)1(









所以,95.01)6745.0)((

1

SkPP

小误差概率为一级,故可用





)(

ˆ

)1(

ˆ

)1(

ˆ

286574313834)1(

ˆ

)1()1()0(

089995.0)1(

kxkxkx

ekxk

进行预测,2001-2005年预测值为

)9(

ˆ

),8(

ˆ

),7(

ˆ

),6(

ˆ

),5(

ˆ

ˆ)0()0()0()0()0()0(xxxxxX

=(38713,42359,46318,50712,55488)

例6-3

预测实例,已知某企业2001-2005年的工业总产值

年份20042005

总产值1.671.511.032.141.99

建立Gm(1,1)模型的白化方程,预测2006-2015工业总产值。

解:)5(),4(),3(),2(),1()0()0()0()0()0()0(xxxxxX

99.1,14.2,03.1,51.1,67.1

)5(),4(),3(),2(),1()1()1()1()1()1()1(xxxxxX

43.8,35.6,21.4,18.3,67.1

对)1(X作紧邻均值生成,令

)1(5.0)(5.0)()1()1()1(kxkxkZ

)5(),4(),3(),2(),1()1()1()1()1()1()1(zzzzzZ

345.7,28.5,695.3,425.2,67.1

于是,

1345.7

128.5

1695.3

1425.2

1)5(

1)4(

1)3(

1)2(

)1(

)1(

)1(

)1(

z

z

z

z

B,

99.1

14.2

03.1

51.1

)5(

)4(

)3(

)2(

)0(

)0(

)0(

)0(

x

x

x

x

Y





1345.7

128.5

1695.3

1425.2

1111

345.728.5695.3425.2

BB

4745.18

745.18361.101



8747.134669.0

34669.007398.0

)(1BB





99.1

14.2

03.1

51.1

1111

345.728.5695.3425.2

YB

67.6

38335.33





67.6

38335.33

8747.134669.0

34669.0003798.0

)(

ˆ1YBBB

b

a

a

931.0

157.0

方程为bax

dt

dx

)1(

)1(

931.0157.0)1(

)1(

x

dt

dx

及时间响应式

a

b

e

a

b

xkxak))1(()1(

ˆ)0()1(

93.5)93.567.1(157.0ke

93.56.7157.0ke

求)1(X的模拟值

)5(

ˆ

),4(

ˆ

),3(

ˆ

),2(),1(

ˆ

ˆ)1()1()1()1()1()1(xxxxxX



=(1.67,2.962,4.474,6.202,8.311)

还原出)0(X的模拟值,由

)(

ˆ

)1(

ˆ

)1(

ˆ)1()1()0(kxkxkx

得)5(

ˆ

),4(

ˆ

),3(

ˆ

),2(

ˆ

),1(

ˆ

ˆ)0()0()0()0()0()0(xxxxxX

=(1.67,1.292,1.512,1.728,2.109)

计算X与X

ˆ的灰色关联度

))1()5((

2

1

)1()((

4

2

xxxkxS

k



=17.032.0

2

1

47.064.061.0(

)1(

ˆ

)5(

ˆ

(

2

1

)1(

ˆ

)(

ˆ

(

ˆ4

2

xxxkxS

k



439.0

2

1

058.1580.0378.0

=0.2585





4

2

))1(

ˆ

)5(

ˆ

())1()5((

2

1

))1(

ˆ

)(

ˆ

())1()((

ˆ

k

xxxxxkxxkxSS

)32.0439.0(

2

1

47.0058.0()64.0158.0(16.0378.0(

0595.0417.0482.0218.0

=0.0885

517.1

4285.1

0885.02585.017.01

2585.017.01

ˆˆ

1

ˆ

1









SSSS

SS

=0.94>0.90

精度为一级,关联度为一级,可以用





)(

ˆ

)1(

ˆ

)1(

ˆ

93.56.7)1(

ˆ

)1()1()0(

157.0)1(

kxkxkx

ekxk

进行预测。

),10(

ˆ

),9(

ˆ

),8(

ˆ

),7(

ˆ

),6(

ˆ

ˆ)1()1()1()1()1()1(xxxxxX

)15(

ˆ

),14(

ˆ

),13(

ˆ

),12(

ˆ

),11(

ˆ)1()1()1()10)1(xxxxx

,293.25,756.20,879.16,565.13,732.10

523.62,577.52,076.44,811.36,601.30

)15(

ˆ

,),10(

ˆ

),9(

ˆ

),8(

ˆ

),7(

ˆ

),6(

ˆ

ˆ)0()0()0()0()0()0()0(xxxxxxX

,537.4,877.3,314.3,833.2,421.2

946.9,501.8,265.7,21.6,308.5

(1,1)模型的适用范围

命题4.3.1当22

11

22

1

nn

kk

nzkzk









时,GM(1,1)模型无

意义。因为此时,ab





命题4.3.2当GM(1,1)发展系数2a时,GM(1,1)模型无意

义。即当2a时,GM(1,1)模型才有意义。但随着a的取值不同,

预测效果也不同。要得到较高精度,要求

22

,2,2

11

a

nn











也可以推出级比22

0

11,nnkee









第五章灰色系统预测

预测就是借助于过去的探讨去推测,了解未来。灰色预测就

是通过原始数据的处理和灰色模型的建立,发现,掌握系统发展

规律,对系统未来状态做出科学定理预测。

定义5.1.1设原始数据序列

0000

((1),(2),,())Xxxxn

相应的预测模型模拟序列



0000

1,2,xxxxn







残差序列





0000

000000

1,2,

(1)1,(2)2,()

n

xxxxxnxn













相对误差序列













000

000

12

,,,

1

12k

n

n

xxxn













1.对于kn,称



0

0

k

k

xk









,为k点的模拟相对误差,称

1

1n

k

k

n

为平均相对误差。

2.称1为平均相对精度,1

k

为k点的模拟精度。

3.给定,当

n

且成立时,称模型为残差合格模型。

定义5.1.2设0X为原始序列,0

X为相应的模拟序列,为0X

与0

X的绝对关联度,若对于给定的

0

0,有

0

,则称模型为

关联度合格模型。

定义5.1.3设0X为原始序列,0

X为相应的模拟序列,0为0X

与0

X的残差序列,则

2

020

1

11

11

,

nn

kk

xxkSxkx

nn





分别为0X的均值、方差;

2

020

2

11

11

,

nn

kk

kSk

nn







分别为残差的均值、方差。

1.2

1

s

C

s

称为均方差比值,对于给定的

0

0C,当

0

CC时,称模

型为均方差比合格模型。

2.1

0.6745ppkS称为小误差概率,对于给定的

0

0p

0

pp,称模型为小误差概率合格模型。

精度检验等级参照表

相对误差

关联度

0

均方差比值

0

C

小误差概率

0

p

一级

0.010.900.350.95

二级

0.050.800.500.80

三级

0.100.700.650.70

四级

0.200.600.800.60

5.2数列预测

数列预测是对系统变量的未来行为进行预测,GM(1,1)

是较常用的数列预测模型。根据实际情况,也可以考虑采用其他

灰色模型,在定性分析的基础上,定义适当的算子,对算子作用

后的序列建立GM模型,通过精度检验后,即可用于预测。

例5.2.1河南省长葛县乡镇企业产值(数据来源于长葛县统

计局)。

解由统计资料查得产值序列为



00000

((1),(2),(3),(4))18035388Xxxxx,,,引入二

阶弱化算子2D,令

00000

((1),(2),(3),(4))XDxdxdxdxd

其中

0000

1

()(()(1)(4));

41

xkdxkxkx

k





以及22222

00000

((1),(2),(3),(4))XDxdxdxdxd

其中

2

0000

1

()(()(1)(4));

41

xkdxkdxkdxd

k





于是

2

0

(27260,29547,32411,35388)1,2,3,4XDXxxxx

X的1-AGO序列为

127260,56807,89218,124606X

设1

1

dx

axb

dt



按最小二乘法求得参数,ab的估计值为

0.089995,25790.28ab

得GM(1,1)模型白化方程

1

1

0..28

dx

x

dt



其时间响应式为





0.089995

1

011

74

11

kxke

xkxkxk





得模拟序列

1,2,,427260,29533,32337,35381Xxxx

残差序列00,6,74,7

相对误差序列















000

000

1,2,34

12

,,,

12

0,0.0002,0.00228,0.0002,

n

xxxn













平均相对误差

4

1

1

0.000670.067%0.01

4k

k



模拟误差

4

0.00020.1,精度为一级。

计算X与x的灰色绝对关联度:

3

2

1

14111502

2

k

sxkxxx











3

2

1

14111430.5

2

k

sxkxxx











3

2

1

11414171.5

2

k

ssxkxxkxxxxx







从而

1||||

.5

0.9970.90

.571.5

1||||||

ss

ssss











关联度为一级

计算均方差比C





4

1

2

4

2

11

1

1

31151.5,

4

1

37252465,6103.48

4

k

k

xxk

SxkxS









4

1

2

4

2

22

1

1

18.75,

4

1

4154.75,64.46

4

k

k

k

SkS









所以2

1

64.46

0.010.35

6103.48

S

C

S

,均方差比值为一级。

计算小误差概率:





1

0.67454116.80

118.75,224.75

355.25,411.75

S









所以1

0.67451>0.95ppkS,小误差概率为一级,故可用





0.089995

1

011

74

11

kxke

xkxkxk





进行预测。这里给出5个预测值





5,6,,9

38714,42359,46349,50712,55488

Xxxx

👁️ 阅读量:0