第二个问题是动态和稳态。动态模型的作用有两个:一是描述输出需要多少时间才能达到某一数值;二是输出最终能够达到什么数值。用股票市场举一个例子,你需要知道两件事,一是这只股票最后会升到多少,是需要多少时间才能升到那里,只知道其中一个对你并没有太大的用处。当然为了简化,这里假定这只股票一路升,不来忽升忽降(也就是非线性)或跌买涨卖(也就是闭环影响)的名堂。这就要求输入-输出数据必须包含充分的动态和稳态信息,过于偏颇其中一方面对另一方面会不利。所以,长期稳定运行的过程中可能包含足够的稳态数据,但动态不足;常年不怎么稳定的过程可能包含丰富的动态数据,但稳态不足。用PID控制打比方,jingque的稳态数据有助于计算正确的比例控制增益,jingque的动态数据有助于计算正确的积分和微分增益,显然,把比例增益整对了更为重要。为了获得jingque的稳态,在辨识中不仅需要过程开环,还需要等过程受到激励、稳定下来后才进行下一步激励。但是问题在于,实际过程有时时间常数很长,几个精馏塔一串联,时间常数几个小时是客气的,一两天都是有可能的。这样一来,一个不太大的模型,十来个变量,开环试验一做就是一两个星期或者更长。这不光是测试工作量和影响生产的问题了,要是一个装置能够两个星期开环,那也不需要什么控制了。
第三个问题是激励的信噪比。都说人类活动是大气中二氧化碳含量上升和温室效应的主要原因,但要是你去生一堆火,再去高空大气层去测测二氧化碳和温室效应,肯定什么也测不出来,本来是多少,现在还是多少。为什么呢?不是因为这堆篝火没有效果,而是环境中的自然变化远远超过了篝火的作用。换句话说,就是噪声远远超过了信号,信噪比不足。工业测试也是一样,信号相对于噪声一定要有一定的强度,否则是白耽误工夫。信号强度zuihao到达使过程达到失稳的边缘,这样才好获得在大范围内都jingque的模型,以便最终设计出来的控制器不光在“风平浪静”的情况下可以正常工作,在“惊惊涛骇浪”的情况下也能使系统恢复稳定。然而,工厂以生产为主,在一切都“斤斤计较”的今天,如此大范围、长时间的测试所带来的产品损失甚至对设备的可能危害,都是工厂极不愿意见到的。理论家们设计了一个伪随机信号,用一连串宽窄不等的方波信号作为激励过程的输入,在理论上可以使过程参数的平均值不致偏离设定值太多。但即使不惜报废大批产品,伪随机信号的脉冲宽度也不好确定:太窄了,稳态数据不够:太宽了,和常规的阶跃信号就没有什么两样了。所以伪随机信号在实际中用得很少。
激励的信噪比是很重要的,如果激励的强度远远低于噪声,则无法得到有用的数据和模型
第四个问题是输入的相关性。实际工业过程到了要用辨识来确定模型的时候,大多是单回路对付不了的情况,所以多为多变量过程。在理论上,多个输入变量可以同时变化,只要输入变量的变化是相互独立的,数学上允许多个输入变量同时变化,辨识也可以正确地辨别模型。然而,在使用实际过程的历史数据时,常常遇到多个输入变量并不相互独立的问题。比如说,在制作巧克力的过程中,香草巧克力比较“苦”,或者说不太甜,牛奶巧克力比较甜。问题是做牛奶巧克力时,不光加糖,还要加牛奶(废话,不加牛奶那还是牛奶巧克力吗),由于牛奶和糖两者总是同时出现,或者同时消失,从纯数学角度来说,在甜度模型里,就难以辨别甜度是由于加糖的关系,还是由于加牛奶的关系。有的时候可以根据对具体过程的认识,人为地限制辨识的过程,来消除这种影响:有的时候,就不太容易了,只好不用历史数据,专门做试验,用各自独立的输入辨识模型。
第五个问题是模型结构。模型结构包括两个方面,一是模型的阶数;二是剔除在物理上不可能的模型。辨识的模型归根结底还是差分方程,这就有一个如何预设阶数的问题。回到村头锅炉房的问题,也就是到底需要考虑多少分钟前的水温和热水开度:阶数太低,会忽略很多本质的东西,比如用直线来拟合两头翘的香蕉形的数据集,总是不可能兼顾全范围的拟合精度:阶数太高,则有喧宾夺主或者被数据里的噪声所迷惑的危险,把每一道拐弯都当作真实物理现象的数学表现来拟合,对实际数据噪声过于敏感,甚至被彻底误导。数学上有很多验前和验后的检验方法,但不仅用起来麻烦,而且也需要很多经验判断。在工业上,人们有时可以偷一个懒,改用非参数模型,也就是用一条响应曲线而不是一个方程来表述一个模型,这样就可以绕过阶数的问题。但是剔除不现实的模型依然是一个手工活,需要仔细研究每一个模型,以确定模型所描述的动态关系是否合理,尤其是增益的正负和数量级,现有数学方法还是不够可靠的。
在搞模型的人中间,常常会听到黑箱、白箱和灰箱的说法。黑箱模型就是不理会实际过程的物理、化学性质,纯粹从数学出发,假设一个模型结构,然后用种种数学方法凑出一个zuihao的模型。白箱反其道而行之,从物理、化学性质出发,建立机理模型,在必要的时候用实验数据确定所剩不多的若干经验参数。灰箱模型介于两者之间。
黑箱模型的好处是在方法上“放之四海而皆准”,不需要对具体过程有深入的了解。但这是一种削足适履的做法,如果“足”本身形状比较好,不需要削太多就能适应,这算撞上大运了:实际世界里的“足”大多有点七歪八扭,需要削不少足,才能塞进那个履。问题是,足削得多了,这还是本来那个足吗?
由于黑箱模型可以自由假设模型结构,黑箱模型的处理和使用都比较方便。黑箱模型是经验主义的,数据里没有包含的情况,黑箱模型无法预测,所以用黑箱模型外推是一个很冒险的事情,问题在于,模型的生命力就在于外推能力。
数据点都是离散的,数据点之间是有间隙的;数据点也是有范围的,超过现有数据点的上限和下限就。。。没了。但模型的用处在于两点:在数据集内部填补空隙,提供“无缝数据”;在数据集上下限之外一定范围内也能适用,预测模型尤其要求如此。数据点之间填补空隙称为内插,数据点范围之外使用称为外推。外推说穿了就是一种合理猜想,“一直都是这样的,再往前走一步也应该八九不离十”。要是数据点很稀疏,或者时密时疏,在稀疏点之间的内插也具有了外推的特质,因为这里已经不是邻里之间的空档,而是无人涉足过的处女地。
白箱模型是“量身定造”的,反映了过程的物理、化学特质,对实际过程的经验数据依赖较少,对数据中不包含的情况也能可靠地预测。实际数据对白箱模型来说,与其说用来建模,不如说是用来校验模型jingque度的,顶多用来测定少数几个经验参数。但是白箱模型的结构由具体问题决定,得出的模型不一定容易使用。
在实际中,人们经常在假设一个模型结构的时候考虑进大大简化的过程机理,所以模型结构不是凭空拍脑袋出来的,而是概略地抓住了过程的基本特质,然后再用黑箱方法的“数据绞肉机”(包括可调的经验参数),将简化模型没有能够捕捉的细枝末节一网打尽。这种模型结合了黑箱和白箱的特点,所以称为灰箱。在实际建模中,纯粹黑箱或白箱的成功例子很少,而灰箱的成功机会却要大得多。
不管什么箱,最后还是有一个如何辨识实际过程的问题。闭环辨识的好处不用多说了,问题是如何从闭环辨识中获得有用的模型。工业上有个办法(没有一个“官名”,但实际上是一个开环-反馈过程)。具体做法是这样的:先用粗略的过程知识构造一个简单的多变量控制器,其任务不是jingque控制被控过程,而是将被控变量维持在极限之内,保证不致失控,且通近或超过极限,就采取强力控制动作将其“赶”回极限内:但只要在极限内,就按部就班地做阶跃扰动,测试过程特性。测试的结果用来改进控制器的模型,然后再来一遍。几遍(一般两遍就够了)下来之后,模型精度应该很不错了。这个方法比较好地解决了辨识精度和过程稳定性的要求,不过要求极限之内有很大的活动空间,也要求过程特性比较“温和”、不“暴戾”,不会一触即跳,像脱缰的野马一样,拉也拉不住。当然,这样的“好脾气”过程直接用常规的开环辨识,只要小心一点,一般也不至子出问题,用不着这样复杂的开环-反馈方法。还是老规矩,管用的不一定需要,需要的不一定管用,世界上的事情总是这么拧。