从材料数据到材料知识:模糊系统方法
王立新
上海大学材料基因工程研究院
摘要
机械照搬数据挖掘与机器学习方法,并不能有效解决材料基因研究中的问题,因为机器学习方法是为解决“正向问题”而设计的,即对于类似的输入(比如一幅与数据集类似但不同的图像)能否给出正确的输出(图像的正确分类),而材料基因研究的主要任务是解决“反向问题”,即对于给定的输出(某项指标的最优值)如何确定合适的输入(具体的实验设计与参数)。为了使机器学习方法适用于解决“反向问题”,关键是所得到的机器学习模型应该具有很好的可解释性。在众多的机器学习模型中,模糊系统模型具有非常好的可解释性,因为模糊系统本身就是由IF-THEN规则构建的,而IF-THEN规则很容易被人理解。本报告首先介绍四种基本的模糊系统数据挖掘方法:WM方法、多层模糊系统、投影跟随模糊系统、及模糊自适应规则系统,然后剖析模糊系统方法在解决材料基因研究问题中的三大优势:1)将数据与专家经验有机结合,得到覆盖面更广、更易于理解的模型;2)通过模糊隶属函数的巧妙选取,区分内插与外推,建议合理有效的新实验方案;3)从学习好的模糊系统模型可以有效地提取新的经验与知识,为新型材料试验提供更加新颖的思路与启发。
DOI: 10.12110/firstfmge.20171121.417
1992年美国南加州大学电机工程系获博士学位,1993至2007年任教于香港科技大学电子与计算机工程系,2007年辞去香港科大终身教职,专心从事金融投资系统的理论研究与实践,2013年重返学术界,先后任教于西安交通大学、中国科学院大学及上海大学。
在以下五个方面为模糊系统及模糊控制领域作出开拓性贡献:1)提出第一个由数据产生语言规则的方法--WM方法,促成并引领模糊神经网络领域的形成与发展;2)证明模糊系统是万能逼近器,开创模糊逼近领域;3)设计出第一个确保稳定性的自适应模糊控制器,引领模糊控制理论及应用二十多年来蓬勃的发展;4)建立多层模糊系统的基础理论,为性能更加优越的深度模糊系统理论奠基;5)出版模糊系统与模糊控制领域的经典教材,为领域的进步作出基础性贡献。以上研究成果被广泛引用,其中有六篇成果在Google Scholar上单篇他引超过1000次(至2017年9月),分别为单篇他引4415,4046,3131,2445,1716及1316次。
近年来,从人工智能视角研究金融系统,开创“投机动态系统理论”和“模糊舆情网络理论”,为“智能金融学”的建立提供基石。