首页互联网数学模型第四版课后答案,数学模型姜启源第五版课后答案

数学模型第四版课后答案,数学模型姜启源第五版课后答案

编程之家2024-06-112次浏览

一、什么是数学模型

数学模型是针对参照某种事物系统的特征或数量依存关系,采用数学语言,概括地或近似地表述出的一种数学结构,这种数学结构是借助于数学符号刻划出来的某种系统的纯关系结构。

数学模型第四版课后答案,数学模型姜启源第五版课后答案

二、什么是模型,什么是数学模型

数学模型是指一种指用数学语言和符号来描述现实世界中各种情形和现象的工具。数学模型通常由多个方程式组成,这些方程式描述了模型中各个变量之间的关系,从而帮助我们更好地理解和预测实际问题。

通过使用数学模型,人们可以发现问题的本质并理清需要解决的关键因素。

在物理、工程、社会学、生物学等领域,数学模型都被广泛地应用来研究各种问题。

例如,人们可以通过开发气象模型来预测天气,或者使用市场经济模型来预测股市和货币汇率的趋势。

三、数学模型和机器学习算法有什么区别

传统数学建模是我们在学校里都学过的建模方法,该方法中,数学家们基于专家经验和对现实世界的理解进行建模。而机器学习建模则是另一种完全不同的建模方式,机器学习算法以一种更加隐蔽的方式来描述一些客观事实,尽管人类并不能够完全理解模型的描述过程,但在大多数情况下,机器学习模型要比人类专家构建的数学模型更加精确。当然,在更多应用领域(如医疗、金融、军事等),机器学习算法,尤其是深度学习模型并不能满足我们需要清晰且易于理解的决策。

本文着重讨论传统数学建模和机器学习建模的优缺点,并介绍一个将两者相结合的方法——解耦表示学习(DisentangledRepresentationLearning)。

数学模型第四版课后答案,数学模型姜启源第五版课后答案

如果想在自己的数据集上尝试使用解耦表示学习的方法,可以参考Github上关于解耦学习的分享,以及GoogleResearch提供的关于解耦学习的项目代码。

1.深度学习存在的问题

由于深度学习技术的发展,我们在许多领域都对神经网络的应用进行了尝试。在一些重要的领域,使用神经网络确实是合理的,并且获得了较好的应用效果,包括计算机视觉、自然语言处理、语音分析和信号处理等。在上述应用中,深度学习方法都是利用使用线性和非线性转换对复杂的数据进行自动特征抽取,并将特征表示为“向量”(vector),这一过程一般也称为“嵌入”(embedding)。之后,神经网络对这些向量进行运算,并完成相应的分类或回归任务:

从特征提取和准确度来看,这种“嵌入”的方法非常有效,但在许多方面也存在不足:

可解释性:嵌入所使用的N维向量无法对模型分析的原理和过程进行很好的解释,只有通过逆向工程才能找到输入数据中对分析影响更大的内容。

数据需求量庞大:如果只有10~100个样本,深度学习无法使用。

数学模型第四版课后答案,数学模型姜启源第五版课后答案

无监督学习:大多数深度学习模型都需要有标签的训练数据。

零样本学习:这是一个很关键的问题,基于一个数据集所训练出的神经网络,若不经过重新训练,很难直接应用在另一个数据集上。

对象生成:除了GANs(生成对抗网络)以外,其他模型都很难生成一个真实的对象。

对象操作:难以通过嵌入调整输入对象的具体属性。

理论基础:虽然我们已经掌握了比较通用的逼近理论,但这还不够。

这些问题很难用机器学习框架来解决,但在最近,我们取得了一些新的进展。

2.数学建模的优势

在20年、50年甚至100年以前,大多数数学家都没有遇到过上述问题。其中原因在于,他们主要关注数学建模(mathematicalmodeling),并通过数学抽象来描述现实世界中的对象和过程,如使用分布、公式和各种各样的方程式。在这个过程中,数学家定义了我们在标题中提到的常微分方程(ordinarydifferentialequations,ODE)。我们通过对比深度学习存在的问题,对数学建模的特点进行了分析。需要注意的是,在下面的分析中,“嵌入”代表数学模型的参数,如微分方程的自由度集合。

可解释性:每个数学模型都是基于科学家对客观事物的描述而建立的,建模过程包含数据家对客观事物的描述动机和深入理解。例如,对于物理运动的描述,“嵌入”包括物体质量、运动速率和坐标空间,不涉及到抽象的向量。

数据需求量小:大多数数学建模上的突破并不需要基于巨大的数据集进行。

无监督学习:对数学建模来说也不适用。

零样本学习:一些随机微分方程(如几何布朗运动)可以应用于金融、生物或物理领域,只需要对参数进行重新命名。

对象生成:不受限制,对参进行采样即可。

对象操作:不受限制,对参数进行操作即可。

理论基础:上百年的科学基础。

我们没有使用微分方程解决所有问题的原因在于,对于大规模的复杂数据来说,微分方程的表现与深度学习模型相比要差得多,这也是深度学习得到飞速发展的原因。但是,我们仍然需要人工的数学建模。

3.将机器学习与基于人工的建模方法相结合

如果在处理复杂数据时,我们能把表现较好的神经网络和人工建模方法结合起来,可解释性、生成和操作对象的能力、无监督特征学习和零样本学习的问题,都可以在一定程度上得到解决。

对于微分方程和其他人工建模方法来说,图像处理很难进行,但通过和深度学习进行结合,上述模型允许我们进行对象的生成和操作、可解释性强,最重要的是,该模型可以在其他数据集上完成相同的工作。该模型唯一的问题是,建模过程不是完全无监督的。另外,对于对象的操作还有一个重要的改进,即当我改变”胡须“这一特征时,程序自动让整张脸变得更像男人了,也就是意味着,模型中的特征虽然具有可解释性,但特征之间是相关联的,换句话说,这些特征是耦合在一起的。

下图展示了使用其中一个单一特征对心跳数据进行操作的过程,其中黑线代表心跳,使用的特征数据值从-3逐渐增大至3。在这一过程中,其他特征始终保持不变。不难发现,第5个特征对心跳形式的影响很大,第8个代表了心脏病的情况(蓝色心电图代表有梗塞症状,而红色则相反),第10个特征可以轻微地影响脉博。

图:对心电图的心跳进行解耦

正如预期的一样,金融数据的实验效果没有这么明显。模型的训练参数设置与上一实验相似。使用的数据为2017年收集的比特币价格数据集,该数据集包含一个时间长度为180分钟的比特币价格变化数据。预期的实验效果为使用beta-VAE学习一些标准的金融时间序列模型,如均值回归的时间序列模型,但实际很难对所获得的表示进行解释。在实验结果中可以发现,第5个特征改变了输入的时间序列的趋势,第2、4、6个特征增加/减少了时间序列上不同阶段的波动,或者说使其更加趋于稳定或动荡。

图:对比特币的收盘价格进行解耦

多个对象的解耦

假设在图像中包含多个对象,我们想要找出每一个对象的影响因素。下面的动图展示了模型的效果。

上文的模型几乎具备了数学建模的全部优质特性,也具有深度学习在分析复杂数据时的高准确度。那么,如果能使用完全无监督的方式,从复杂数据中学习到如此好的表示结果,是不是意味着传统数学建模的终结?如果一个机器学习模型就可以对复杂模型进行构建,而我们只需要进行特征分析,那还需要基于人工的建模吗?这个问题还有待讨论。

小米开发者选项在哪 小米开发者选项在哪里打开三星手机爆炸(三星爆炸是怎么回事)