姜启源-数学模型
第2章 初等模型¶
-
2.3 实物交换:无差别曲线(其实就是生产可能性边界)
-
2.4 汽车刹车距离与道路通行能力:
- 交通流:流量、速度、密度
- Greenshields(1935) 车速与密度:\(v=v_f(1-k/k_j)\),\(v_f\)是密度为0的车速,即理论上的最高速度,称畅行速度(自由流);\(k_j\)是速度为0时的密度,称阻塞速度。
- 刹车距离模型:制动距离的得出过程有点意思。参数估计:查阅交通工程学的相关资料,根据实测数据作拟合。
- 道路通行能力模型
-
2.5 估计出租车的总数
由样本估计总数。假定有 \([0001,0002,...,x]\),我们随机抽取\(n\)个号码作为模型样板→\({x_1,x_2,..,x_n}\),需要建立由 \(x_1,x_2,..,x_n\)估计\(x\)的模型。
- 平均值模型:样本平均值等于总体平均值
- 中位数模型:总体中位数=中体平均值=\(\frac{样本中位数+1}{2}\)
- 两端间隔对称模型:\(x-x_n=x_1-1\)
- 平均间隔模型:\(x-x_n=\frac{1}{n}[(x_1-1)+\sum_{i=2}^{n}{(x_i-x_{i-1}-1)}]\)
- 区间均分模型:将总体区间平均分为\(n\)份,假定样本中每个\(x_i\)都在小区间的中点,则\(x-x_n=\frac{x-1}{2n}\)
- 这里的数值模拟是指给定一个总体,从中抽取若干样本,根据5个模型分别对样本进行计算,估计总体,将估计结果与给定总体作对比,根据各个模型的估计值与总体比较的结果做出评价。
- 标准差:中位数 > 平均值 > 两端间隔对称 > 平均间隔
-
2.6 评选举重总冠军
- 数据收集与分析
在建立举重成绩的数学模型时,为了只保留体重而尽量排除其他因素的影响,一个合适的方法是 利用举重比赛的世界纪录。因为作为世界顶级运动员,他们通过严格的选拔和艰苦的训练,在举重技巧的发挥方面已趋完善(当然是在目前的环境条件下,随着时代的发展,运动水平还将提高),不同级别成绩的差别基本上是由运动员体重决定的。另外,多年积累下来的世界纪录 与某一次比赛成绩(如奥运会、世锦赛等)相比,更能避免偶然性。
分析:散点图绘制——>大致线性分布,根据观察取对数——>更加线性 ==> 可能幂函数更好
-
模型建立
-
线性模型:根据数据直接拟合
-
幂函数模型:关键是确定幂次,从**运动生理学角度研究**:合理假定举重成绩和身体肌肉横截面积\(s\)成正比,\(s\)与身体特定尺寸\(l\)的平方成正比,身体体重\(w\)与\(l\)的立方成正比——>\(y=kw^{\frac{2}{3}}\)——>用数据拟合出\(k\)值
\(y=k_1s,\ s=k_2l^2,\ w=k_3l^3\)
-
幂函数改进模型:考虑举重过程中的力量损失和身体尺寸各种变化,体重分为肌肉和非肌肉,改进:\(y=k_1s^\alpha(\alpha<1),\ s=k_2 l^\beta(\beta<2), w=k_3l^3+w_0\)——>\(y=k(w-w_0)^\gamma(\gamma < \frac{2}{3})\),然后利用数据去做拟合
-
评估:各个组别的相对误差取平均
-
-
2.7 核军备竞赛
-
问题:
- 在什么情况下双方的核军备竞赛才不会无限扩张而存在暂时的平衡状态?
- 处于这种平衡状态下双方拥有最少的核武器数量是多大?
- 这个数量受哪些因素影响,当一方采取诸如加强防御、提高武器精度、发展多弹头导弹等措施时,平衡状态会发生什么变化?
-
模型假设
- 第一次核打击会全力攻击对方的核基地
- 己方收到核打击后,应存有足够的核导弹,给对方的工业、交通中心等目标以毁灭式打击
- 实施第一次核打击后,一枚核导弹只能攻击对方的一个核导弹基地,且成功摧毁这个基地的概率是个常数,由一方的攻击精度和另一方的防御程度所决定
-
记\(y=f(x)\text{和}x=g(y)\),前者为甲方有\(x\)枚导弹时,乙方采取核威慑所需的最小导弹数。当\(x=0\),即甲方已经倾尽所有导弹数进行核打击后,乙方为毁灭甲方要低所需的导弹数——威慑值。
-
模型精细化
- \(x<y\),甲方用全部的\(x\)枚导弹攻击乙\(y\)个核基地中的\(x\)时,记每个基地未被摧毁的概率为\(s\),那我们可以算出来乙方经受一次打击后所保存下来的核弹。\(y=y_0+(1-x)x\)
- \(x=y \Longrightarrow y=\frac{y_0}{s}\)
- \(y<x<2y \Longrightarrow y=\frac{y_0}{s(2-s)}+\frac{1-s}{2-s}x\)
- \(x=2y \Longrightarrow y=\frac{y_0}{s^2}\)
- ……
令\(x,y\)取连续值,则\(y=\frac{y_0}{s^{x/y}}\)
-
模型解释
- 甲方增加经费保护及疏散工业、交通中心等目标——>乙方威慑值变大
- 甲方将原来的固定核导弹基地改进为可移动发射架——>甲方残存率变大
-
-
2.8 扬帆起航
物理题……
第3章 简单的优化模型¶
微积分中的函数极值模型
- 优化的目标是什么
- 寻求的决策是什么
- 决策受到哪些限制
- 数学工具表示他们(变量、常量、函数等)
- 对结果作定性、定量的分析和必要的检验
简历优化模型要确定优化的目标和寻求的决策,用 \(x\) 表示 决策变量,\(f(x)\) 表示 目标函数。实际问题一般对决策变量 \(x\) 的取值范围有限制,不妨记作 \(x \in \Omega\), \(\Omega\) 称为可行域。
-
3.1 存贮模型
贮存量太大,贮存费用过高;贮存量小,会导致一次性订购费用变大,或不能及时满足需求。
在需求量稳定的前提下讨论两个简单的存贮模型:不允许缺货模型和允许缺货模型。前者适用于一旦出现缺货会造成重大损失的情况(如炼铁厂对原料的需求)。后者适用于像商店购货之类的情形,缺货造成的损失可以允许和估计
-
不允许缺货的贮存模型
-
问题:配件厂为装配线生产若干种部件,轮换生产不同的部件时因更换设备要付 生产准备费(与生产数量无关),同一部件的产量大于需求时因积压资金、占用仓库要付 贮存费。今已知某一部件的 日需求量100件,生产准备费5000元,贮存费每日每件1元。如果生产能力远大于需求,并且不允许出现缺货,试安排该产品的生产计划,即 多少天生产一次(称为生产周期),每次产量多少,可使平均每天总费用最小。
-
模型假设:
- 产品的每天需求量、每次生产的准备费、每天每件产品贮存费
- 生产能力为无限大(相对于需求量),当贮存量降到零时,Q件产品立即生产出来供给需求,即不允许缺货。
-
模型建立:\(C=\frac{c_1}{T}+\frac{c_2rT}{2}\)
- 结果解释
- 敏感性分析【基于导数的局部敏感性分析】
- 用相对改变量衡量结果对参数的敏感程度,T 对 c₁ 的敏感度记作S(T, c₁),定义为 $$ S(T, c_1) = \frac{\Delta T/T}{\Delta c_1/c_1} \approx \frac{\mathrm{d}T}{\mathrm{d}c_1} \frac{c_1}{T} $$
-
-
允许缺货的贮存模型
-
模型假设:
- 产品的每天需求量、每次生产的准备费、每天每件产品贮存费
- 生产能力为无限大(相对于需求量),允许缺货,每天每件产品缺货损失费为c,但缺货数量需在下次生产(或订货)时补足
-
模型建立……
- 结果解释……
-
-
相关思考
关于不考虑生产成本:总需求量固定,且单位生产成本恒定。 在这种情况下,总生产费用是一个**沉没成本 (Sunk Cost)**,与我们要做的“生产多少批量”的决策无关,因此可以在优化过程中被忽略。【实际上,在计算过程中,求导会消去】
-
-
3.5 不买贵的只买对的
- 效用函数
$$ U(x)=ax^{\alpha} $$
- 边际效用:\(\frac{d U(x)}{dx}\)表示商品数量\(x\)增加1个单位时效用函数\(U(x)\)的增量
-
3.6 血管分支
-
背景:研究血管分支处粗细血管半径的比例和分叉角度,在消耗能量最小原则下应该取什么样的数值
-
模型假设
-
一条粗血管在分支点处分成两条细血管,分支点附近三条血管在同一平面上,有一对称轴。因为如果不在一个平面上,血管总长度必然增加,导致能量消耗增加,不符合最优原则。这是一条几何上的假设。
-
在考察血液流动受到的阻力时,将这种流动视为黏性流体在刚性管道中的运动。这当然是一种近似,实际上血管是有弹性的,不过这种近似的影响不大。这是一条物理上的假设。
-
血液对血管壁提供营养的能量随管壁内表面积及管壁所占体积的增加而增加管壁所占体积又取决于管壁厚度,而厚度近似地与血管半径成正比。这是一条生理上的假设。
-
-
-
3.7 篮球罚球命中
-
模型建立步骤:
-
不考虑篮球和篮筐的大小,将篮球视作位于球心的质点,,讨论球心正好命中篮筐中心的理想情况,确定出手高度、出手角度及出手速度v之间的关系。
-
考虑篮球和篮筐的大小,讨论球心命中筐心且罚球命中的条件,确定入射角与出手高度、出手角度之间的关系。
- 考虑篮球和篮筐的大小,讨论容许球心向前或向后偏离筐心且罚球命中的情况。
-
-
对于模型二:考虑直径的情况下,球要顺利入框应检查入射角的大小,有最小值
-
对于模型三:偏心将导致篮球入框条件下最小入射角的改变
-
-
3.8 影院里的视角和仰角×
-
3.9 √
敏感性分析?
第4章 数学规划模型¶
在上一章的优化模型的基础上继续提高,决策变量通常有更多个,用 \(n\) 维向量 \(\mathbf{x}=(x_1, x_2, \cdots, x_n)^T\) 表示, 目标函数 \(f(\mathbf{x})\) 是多元函数, 可行域 \(\Omega\) 比较复杂, 常用一组不等式(也可以有等式) \(g_i(\mathbf{x}) \le 0 \, (i=1, 2, \cdots, m)\) 来界定, 称为 约束条件。 一般地, 这类模型可表述成如下形式:
当实际问题具有以下性质时,其模型才是线性规划:
- 比例性 (Proportionality):决策变量对目标函数和约束条件的影响(贡献)与其自身取值成正比。
- 可加性 (Additivity):不同决策变量对目标和约束的影响是相互独立的,总影响等于各自影响的简单加和。
- 连续性 (Continuity / Divisibility):决策变量的取值可以是任意非负实数(即可为小数),不要求必须是整数。
4.1 什么是线性规划?¶
线性规划 (Linear Programming, LP) 是运筹学中一个核心且应用广泛的数学优化方法。它用于解决这样一类问题:在给定一组**线性**的约束条件下,如何找到一个**线性**目标函数的最优值(最大值或最小值)。
其关键特征有两个: 1. **目标函数**是线性的。 2. **约束条件**是线性的等式或不等式。
线性规划在生产计划、物流运输、投资组合、资源分配等领域有大量实际应用。
4.2 线性规划的数学模型¶
一个标准的线性规划问题由三个核心部分构成:决策变量、目标函数和约束条件。
- 决策变量 (Decision Variables)
决策变量是我们为了解决问题需要确定的未知数,通常表示为 \(x_1, x_2, \dots, x_n\)。它们代表了我们要分配的资源量、生产的产品数量等。
- 目标函数 (Objective Function)
目标函数是我们希望最大化或最小化的量,例如利润最大化或成本最小化。它被表达为决策变量的线性组合。
其一般形式为: $$ \max(\text{or } \min) \quad Z = c_1x_1 + c_2x_2 + \dots + c_nx_n $$ 其中 \(c_j\) 是常数,代表每个决策变量 \(x_j\) 对目标值的贡献系数。
- 约束条件 (Constraints)
约束条件是决策变量必须满足的一系列线性的等式或不等式,反映了实际问题中的资源限制、物理限制或规则要求。
其一般形式为: $$ \text{s.t. (subject to)} \quad \begin{cases} a_{11}x_1 + a_{12}x_2 + \dots + a_{1n}x_n \le (\ge, =) b_1 \ a_{21}x_1 + a_{22}x_2 + \dots + a_{2n}x_n \le (\ge, =) b_2 \ \vdots \ a_{m1}x_1 + a_{m2}x_2 + \dots + a_{mn}x_n \le (\ge, =) b_m \end{cases} $$
此外,通常还有一个隐含的约束,即**非负约束**:\(x_j \ge 0\) 对所有的 \(j=1, \dots, n\) 成立,因为在现实世界中产量、数量等不能为负。
-
相关概念
-
有效约束(紧约束):刚好到达某一个人约束条件的极限情况
- 影子价格:一个约束的影子价格(也称为对偶价格或拉格朗日乘子),指的是当这个约束的右端项(Right-Hand Side, RHS)增加一个单位 时,目标函数的最优值会 变化 多少。
- 整数规划:约束条件中决策变量为整数
4.3 线性规划的基本原理 (几何角度)¶
线性规划的强大之处在于其优美的几何解释。
- 可行域 (Feasible Region)
所有满足约束条件的点的集合构成了一个**可行域**。在二维或三维空间中,这个可行域是一个**凸多边形**或**凸多面体**。所有可行的解决方案都位于这个区域的内部或边界上。
- 最优解的性质
线性规划基本定理: 如果一个线性规划问题存在最优解,那么这个最优解一定可以在其可行域的某个**顶点**(Vertex or Extreme Point)上找到。
这个定理是线性规划求解的理论基石。它告诉我们,我们不需要搜索整个可行域内部的无限个点,而只需要考察有限个顶点,就能找到最优解。
4.4 线性规划的常用解法¶
A 图解法 (Graphical Method)¶
当问题只包含两个决策变量(如 \(x_1\) 和 \(x_2\))时,图解法非常直观。
- 绘制可行域:在二维坐标系中,将每个约束条件(如 \(2x_1 + 3x_2 \le 6\))作为一条直线画出,并根据不等号确定其表示的半平面。所有半平面的交集就是可行域。
- 绘制目标函数线:将目标函数 \(Z = c_1x_1 + c_2x_2\) 看作一条直线(称为等值线)。
- 寻找最优解:平行地移动目标函数线,在不离开可行域的前提下,观察它在最大化(或最小化)方向上最后接触的那个顶点。该顶点的坐标就是问题的最优解。
B 单纯形法 (Simplex Method)¶
对于超过两个决策变量的问题,图解法不再适用。单纯形法是一种高效的代数迭代算法。 * 基本思想:它从可行域的一个顶点开始,沿着可行域的边移动到另一个相邻且目标函数值更优的顶点。 * 迭代过程:通过一系列精确的代数运算(称为“旋转”或“主元变换”),算法不断地从一个顶点跳到下一个更好的顶点,直到找不到任何可以改进的相邻顶点为止。此时,当前顶点即为最优解。 * 优势:虽然在最坏情况下,单纯形法的计算复杂度是指数级的,但在实践中它对于绝大多数问题都非常高效。
C 内点法 (Interior-Point Methods)¶
内点法是另一类求解线性规划问题的重要算法,尤其适用于超大规模问题。 * 基本思想:与单纯形法沿着可行域的边界移动不同,内点法通过一条在可行域**内部**的路径来逼近最优解。 * 优势:它通常比单纯形法能更快地解决某些特定结构的大规模问题。
4.4 技法¶
-
对于约束:如果要生产某一辆汽车,则至少要生产80辆
-
引入 0-1变量,化为整数规划。
设 \(y_i\) 只取 0,1两个值,则“\(x_1=0 或 \ge 80\)” 等价于:
\[ 80y_i \le x_i \le M y_i, \ y_i \in \{0,1\} \] -
分解为多个LP子模型
\[ \begin{align*} & x_1 = 0, x_2 = 0, x_3 \ge 80 \\ & x_1 = 0, x_2 \ge 80, x_3 = 0 \\ & x_1 = 0, x_2 \ge 80, x_3 \ge 80 \\ & x_1 \ge 80, x_2 = 0, x_3 = 0\\ &\dots \end{align*} \] -
化为非线性规划
\[ \begin{align*} & x_1 (x_1 - 80) \ge 0 \\ & x_2 (x_2 - 80) \ge 0 \\ & x_3 (x_3 - 80) \ge 0 \end{align*} \]
-