熊墨淼 (Momiao Xiong)
Society of Artificial Intelligence Research
Department of Biostatistics and Data Science
University of Texas, School of Public Health
---------------------------------------
Contents
01理论是来自于自己的知识背景和工作实践02真实的现实世界是弯曲的,流形的,有几何结构的。而欧氏空间是平坦的,是微分流形在局部区域的近似03数学推理,物理推理,几何推理和通用推理04物理世界的人工智能,『机器人』️设计和分析,无人驾驶等需要现代数学和统计学家,需要几何控制论,需要经典力学和量子力学的知识05软体『机器人』️学06软『机器人』️的数学模型十分复杂。需要考虑微分流形上的数学模型,物理模型。涉及到许多我们不曾学过的知识---------------------------------------从柯尔莫哥洛夫的概率论假设和费希尔的经典统计学谈起经典概率论和统计学主要描述数学结构,其源头是数学本身。人工智能面向现实的物理世界,现代概率和统计要和现实的物理世界结合。
01理论是来自于自己的知识背景和工作实践柯尔莫哥洛夫早年是位数学家。他在莫斯科大学是学习和研究集合论的。在柯尔莫哥洛夫以前,概率是建立在源于直观的频率基础上的。因为观察到的频率本身具有不确定性,这给严谨的数学推理带来了困难。虽然使用频率在当时仍然发展了贝努里定律等,但建立在频率基础上的概率论的发展举步维艰。只是在柯尔莫哥洛夫用集合论和概率空间精确地定义了概率以后,我们才可准确地定义和计算各种概率分布,才逐渐地进步发展了以测度论为基础的概率论理论。经典统计理论是由费希尔等人发展起来的。他早期的工作是在农业试验站,方差分析和试验设计正是基于这些实践最早发展起来的理论。而后发展了假设检验理论和参数估计理论,是工作实践的需要,同时也是工作实践的过程帮助产生概念,定律,推动统计学的发展。
02真实的现实世界是弯曲的,流形的,有几何结构的。而欧氏空间是平坦的,是微分流形在局部区域的近似。在中世纪文艺复兴以前,哥白尼以前,当时人们大脑对世界的想象是以地球为中心的,一眼望去世界都是平的。这个空间称为欧氏空间。笛卡尔坐标系和向量运算是欧氏空间计算的基础。
非欧几何,黎曼几何和微分流形假设世界是弯曲的,我们用流形来描述这个弯曲的空间,而用某点的切平面来近似该点附近的流形空间。犹如一根曲线由若干条短的切线来近似一样,弯曲的流形也是用若干个切平面来近似的。这些切平面犹如欧氏空间的平面,流形就是用欧氏几何的量来近似非欧几何的流形。
由柯尔莫哥若夫发展起来的经典概率论和费歇发展起来的经典统计理论都是建立在欧氏空间基础上的。他们不能用到弯曲的空间,不能用到流形上。我们不能用统计中常用的平均值和方差公式来计算流形上的均值和方差,因为流形上两点之间的最短距离不是直线距离,而是用测地线来计算的。平均值是用Frechet平均值来计算流形上的平均值。经典的方差分析和实验设计不能直接应用到流形上的。经典统计中的主成分分析方法也不能直接用到流形上。他必须用主成分测地线分析方法。经典统计中的大数定律和中心极限定理,Hotelling检验,经典统计中的变量变换公式,列联表统统不能用到流形上。因为流形上的数据不能形成向量,广泛应用的经典的回归分析方法也不能应用到流形上,而必须借助黎曼几何和流形学习的方法重新发展用于流形上的数据的回归分析方法。欧氏空间上的扩散过程,伊藤积分,随机微分方程不能应用到流形上,任何随机过程都必须受非欧氏空间弯曲的约束。一句话,我们现在通用的概率和统计教科书都是在欧氏空间上发展的。现在的统计学有两大基本缺点。一是他们主要讨论变量之间的线性关系。二是他们只应用平坦的欧氏空间。所以,现在是时间用神经网络和微分流行来全面改造现行的概率和统计教科书,重写这些教科书,培养新型一代的统计学家。
03数学推理,物理推理,几何推理和通用推理我们最熟悉的是数学和逻辑推理。根据所观察的数据,我们构造数学模型,用数学模型来预测未来。数学推理尽管是强有力的抽象和精准推理的工具,但在理论上和实践上都有局限性。早在上世纪初期,哥德尔就提出了不完全定理。没有任何一个单𠆤的,相一致的数学系统能捕获所有的数学真理。图灵证明某些计算问题是不可判定的。
数学推理在实际问题求解中也存在若干不可忽视的局限性。它依赖于假设和简化。对初始条件和参数设置很敏感,黑箱和缺乏可解释性。难于和现实考虑融于一体,复杂和规模大,人工智能推理方面的局限性,情况改变,输出就变化很大,缺乏强壮的数据分析的工具,缺乏真正的概念理解。
早在1788年,拉格朗日用变分法和最少行动原理导出了一组运动方程,用推广的坐标和速度来描述动力学,揭开了近代解析力学(或理论力学)的序幕。在1830年左右,哈密尔顿用推广的动量来代替推广的速度进一步发展了拉格朗日力学。在1834年至1835年,他发表了两篇文章。他提出了哈密顿函数,定义其为系统的能量,包括动能与势能两部分。他提出了一般变化原理,现在称之为哈密顿原理。
令人惊叹的是,在上世纪初,当许多物理学家来研究原子和基本粒子的运动规律时,发现许多经典的物理定律都已过时,但哈密顿所奠定的经典力学的框架仍然闪烁着光芒。1926年,薛定谔利用力学和光学之间的类比,发展了奠定了量子力学基础的薛定谔方程。今天,哈密顿力学已广泛地应用于统计物理,最优控制理论(庞特里雅金极值原理)和量子场论。
2019年前后哈密顿力学开始应用到人工智能,神经网络和变压器。一些科学家把传输的信息和内容视作能量,发展了哈密顿神经网络和哈密顿变压器。哈密顿变压器有几个显著的特点。
- 哈密顿神经网络的结构可以保持能量守恒和其他度量如动量。但是一般的神经网络虽然在训练过程中可以近似这些能量,但常常很难长时间地保持守恒,导致能量漂移,发散。
- 哈密顿神经网络可以改善推广的精度。哈密顿神经网络旨在学习具有语义等实际意义的哈密顿函数,而不是去拟合路径上的数据点。所有它在系统参数变化时和训练中没有遇过的数据时,它的推广结果仍然较好。
使用辛几何的梯度为算法的迭代方向。传统的神经网络使用标准的向量微积分,视函数的梯度为函数上升最快的方向。哈密顿系统的物体运动是在相空间上描述的。相空间上的位置变量和动量决定了物体的运动。而辛梯度是哈密顿运动方程的向量场。物体沿着辛梯度运动,保持哈密顿函数,亦即能量不变。在变压器中和能量相对应的是信息量,物体的运动可视为信息的流动。求解哈密顿方程就相当于信息在变压器中的流动,是推理过程。其求解精度,也就是推理的精度。经典力学中的二体,三体和多体运动可用以构造哈密顿函数,它对应于变压器的注意力函数。提高求解哈密顿函数的精度就是提高注意力函数的精度。因为哈密顿函数是描述自然界的规律,在一定程度上也描述了大脑的神经元活动的规律。由二体旋转运动来描述的单词,token之间的关系比注意力函数更接近于语义。
哈密顿-雅可比-贝尔曼(HJB)方程决定了最优控制,它的离散形式是贝尔曼发展的动态规划,HJB方程是庞特里雅金极值原理的产物。HJB方程可用于研究可观察性,可控性,最优控制,因而可以用以发展药物,判断药物的疗效,判断药物能否把病人从疾病状态变换为健康状态(reachable)。HJB可用于诊断故障,质量控制。在人工领域可用于识别产生幻觉的神经元。
在人工智能的研究中,要达到通用智能,我们要把数学脑逐渐转换为生物脑。生物脑是工作在微分流形上。我们观察到的大脑信号是高维的,但它由低维的微分流形所产生的。其数学模型为微分流形上的变分自编器。我们也应把生物脑摸拟为神经微分流形。信息在一层一层的神经网络中的流动可摸拟为信息流的运动
我们的学习经验告诉我们,往往证明过的或检查属实的东西会增强我们的理解和记忆。现在有许多推理问题化为证明和确认的问题,完全改变了我们经典推理的范式,它可以增加我们推理的正确性,减少误差和节省时间。确认推动的求解问题的流水线作业和完全的哈密顿推理模型相结合正在形成统一的推理模式。
04物理世界的人工智能,『机器人』️设计和分析,无人驾驶等需要现代数学和统计学家,需要几何控制论,需要经典力学和量子力学的知识物理真实世界运行的『机器人』️正在完成从硬性的,单一目标的工业『机器人』️向高度灵活的,系统和环境自适应的『机器人』️转变,正在把先进的人工智能原理和硬件相结合,使『机器人』️可以在复杂,不可预测的环境下感知,学习和运行。这种转变正在加速『机器人』️在制造业,逻辑和服务领域的发展。『机器人』️在关键领域的进展包括:
『机器人』️正在把人工智能和机器学习相结合,大量使用『大语言模型』,视觉语言模型,使『机器人』️可以听懂和理解自然语言,正确感知外部环境,执行高水平的推理和计划。使『机器人』️成为自主和具有决策能力的系统。
加强和改善硬件和传感系统。
『机器人』️可以高度灵巧地操作。
人和『机器人』️的相互作用。现在的『机器人』️具有高度安全的传感器,可以和人共同在同一空间如仓库,办公室和医院工作。
数字孪生和模拟。通过数字模拟所获得的知识和经验传递到物理世界,大大减少了『机器人』️部署到真实环境下的时间,改善效率。
正在发展一般目标的人形『机器人』️,可以执行和完成广泛的任务。
05软体『机器人』️学“软体『机器人』️学”致力于使用高柔顺性、高弹性材料(例如硅橡胶和凝胶)制造『机器人』️。这使得它们能够模仿生物运动、适应复杂环境,并安全地与娇嫩的组织互动。该领域背后的理论核心是“具身智能”(embodied intelligence),即『机器人』️的物理形态和材料特性(如杨氏模量与人体组织相似)是其功能以及与周围环境互动不可或缺的一部分,而不是仅仅依赖复杂的外部计算来进行控制。
“软体『机器人』️技术正被应用于多个高度先进的生物医学领域:
微生物递送药物:研究人员正在开发生物混合微型『机器人』️,将合成材料与活体生物(例如细菌或藻类)结合起来,以实现靶向药物递送。
推进方式:这些微型『机器人』️利用微生物的天然运动能力(例如鞭毛运动),或通过外部磁场引导,主动“游动”或“行走”至特定的病变部位(例如『肿瘤』、胃肠道感染)。
靶向定位:微生物可以被特定的抗体包裹,或利用趋化性(朝向病变组织释放的化学信号移动),确保精确的局部定位,从而避免传统给药方式带来的全身性副作用。
释放机制:到达目标位置后,药物(例如化疗药物、『干细胞』)通过各种触发因素释放,例如局部pH值变化、热量(磁热疗)或机械作用。
06软『机器人』️的数学模型十分复杂。需要考虑微分流形上的数学模型,物理模型。涉及到许多我们不曾学过的知识软『机器人』️的设计和分析需要复杂的和高等的数学分析工具。不论是静态的和动态的分析都要和物理世界和几何结构相结合,涉及到许多我们不曾学过的知识
组学与组织分析:软体『机器人』️被用作高精度诊断工具。
活检取样:毫米级软体『机器人』️可以导航狭窄的解剖通道,进行微创、高精度的组织和细胞取样,用于基因组'学、转录组学或蛋白质组学(组学)分析。这可以在没有重大手术风险的情况下获得准确的样本。
组织表征:『机器人』️系统可以使用力传感器定量表征体内软组织的机械特性,这有助于疾病诊断和开发更准确的手术模拟模型。
同步药物开发与组织正常化:最终潜力在于“治疗诊断一体化”(治疗+诊断)软体『机器人』️系统。这些技术旨在:
1. 实时监测与治疗:将传感器集成到可植入的软体设备中,以实时监测免疫反应或生物标志物(如葡萄糖水平或炎症标志物等组学数据)。
2.闭环给药:使用机器学习根据传感器反馈动态调整药物剂量方案,确保在正确的时间输送精确剂量的药物,使组织形状/力学和潜在的组学状态恢复正常。
组织工程:未来应用设想磁驱动软导管在体内进行微创生物打印,利用『干细胞』修复受损组织,从而恢复正常功能和形态。
如果你将其视为一个在流形上的耦合机械化学动力系统,并采用因果、干预感知的参数化和几何最优控制来处理,那么它实际上可以完美地契合在一起。下面是一种具体的将各个部分“组合”成一个联合模型的途径,用于(i)推断组织+组学动力学,以及(ii)控制以驱动异常形状+分子状态朝向期望的正常设定点。1)将所有内容统一为一个受控动力系统。组织力学:Cosserat杆(几何、偏微分方程→常微分方程)。组学动力学:转录+剪接+RNA流速。耦合(关键点)。双向耦合是科学核心:力学→基因表达。应力/应变、曲率、剪切、基质刚度影响转录速率、剪接、降解、信号传导。基因表达→力学。细胞骨架重塑、ECM沉积、收缩性改变杆的刚度/主动应力。
1.将因果推理置于其应有的位置:干预和可识别性。结构因果层。这有两个作用:将基线异质性与真正的治疗效果解耦;使您的控制器作用于可解释的“杠杆”(速率、应力、GRN模块)。
2.推理:如何将此类模型与组织+组学时间序列拟合。观测模型。状态估计。因为力学是连续时间的,而组学可能是稀疏/有噪声的:使用连续-离散状态空间模型(SDE/ODE潜在动力学,离散观测)。使用变分滤波/平滑(摊销推理网络)或粒子平滑进行推理。如果您需要很强的物理一致性:使用伴随梯度通过Cosserat求解器+动力学(PDE约束优化)。
3.控制:将形状+组学驱动到“正常”。定义一个期望的正常目标(设定点或流形)。几何控制如何介入:机械状态存在于SE(3)(或离散化后的李群乘积)上。使用流形感知最优控制:李群上的iLQR/DDP,或黎曼MPC。对于耦合系统,执行分层MPC:内循环:快速稳定力学(形状);外循环:通过药物/调控控制缓慢引导组学。
我们将结合几何控制、Cosserat杆模型、微分流形上的转录非线性,平衡和非平衡态的动力学模型、RNA速度和因果推理模型,哈密顿经典力学和量子力学,哈密顿-雅可比-貝尔曼方程,共同分析组织和组学的动力学,并通过控制将它们的异常状态(组织的形状和组学的数量)恢复到正常状态。
---------------------------------------
排编审|杨丽艳
理解本文所需能力地图与学习方法建议
第一层:数学基础(基石)
所需能力:
1.线性代数:理解向量、空间、变换、特征值。这是理解任何高维数据(如词向量、图像特征)的基础。
2.微积分:理解导数、梯度、积分。这是优化算法(如梯度下降)和动力学系统(微分方程)的核心。
3.概率论与数理统计:理解随机变量、分布、贝叶斯定理、最大似然估计。这是机器学习模型不确定性处理的根基。
如何学习:
1.课程:可汗学院(Khan Academy)、3Blue1Brown(YouTube/B站,有中文)的动画系列直观易懂。
2.书籍:《线性代数应该这样学》、《普林斯顿微积分读本》。
2026年推出熊老师新书上册,现在接受预订,可发送姓名+联系微信号到邮箱1059575790@qq.com将有工作人员和您取得联系。
关键:结合编程。用NumPy实现矩阵运算,用PyTorch/TensorFlow自动求导来感受梯度。
第二层:AI与机器学习核心(主体框架)
所需能力:
1.经典机器学习:理解线性回归、逻辑回归、决策树、聚类等。掌握“过拟合”、“偏差-方差权衡”等核心思想。
2.深度学习:掌握神经网络前向/反向传播、CNN(图像)、RNN/LSTM/Transformer(序列)。Transformer是本文重点,必须深入理解。
3.优化理论:了解梯度下降的各种变体(SGD, Adam)。
如何学习:
1.课程:吴恩达的《机器学习》和《深度学习专项课程》(Coursera)是绝佳的起点。『李宏毅』(YouTube/B站)的中文讲解也非常出色。熊老师的往期课程也可供学习用,欢迎大家留言对感兴趣的学习内容。我们将会进行整理与安排,计划2026年也会不定期的开展直播。预订可发送姓名+联系微信号到邮箱1059575790@qq.com将有工作人员和您取得联系。
2.实践:使用PyTorch框架,在Kaggle上从最简单的比赛(如泰坦尼克号生存预测)开始,模仿并学习别人的代码(Kernel)。
深入Transformer:精读《Attention Is All You Need》论文的解读文章或视频;用代码实现一个迷你Transformer。
第三层:高阶数学与物理(登高望远)
所需能力:
1.微分几何:理解流形、切空间、测地线、曲率。这是理解本文“非欧空间”、“神经微分流形”的钥匙。
2.经典力学:理解拉格朗日力学、哈密顿力学。这是理解文中“哈密顿变压器”、“能量守恒推理”的基础。
3.微分方程:理解常/偏微分方程的基本概念,以及神经ODE的思想。
如何学习:
心态:这一层是长期目标。在打好前两层基础前,只需建立概念认知,知道这些名词是什么,为什么重要即可。
资源:
1.科普入门:观看3Blue1Brown关于“微积分的本质”、“线性代数的本质”的系列,他也有一些关于微分几何的直观介绍。
2.书籍:《微分几何入门与广义相对论》(上册)可作为参考;《经典力学》(Goldstein)是权威教材,但较难。
欢迎关注我们的公众号,同时将在2026年推出熊老师新书下册,现在接受预订,可发送姓名+联系微信号到邮箱1059575790@qq.com将有工作人员和您取得联系。
联系AI:关注几何深度学习、物理启发AI等领域的科普文章和综述论文。当您有了一二层的基础,再读这些材料会更有体会。
第四层:跨领域应用(融会贯通)
所需能力:
1.计算神经科学:了解大脑信息处理的基本模型。
2.控制理论:了解最优控制、强化学习。
3.特定领域知识:如文中提到的软体『机器人』️学、组织力学、基因组学。
如何学习:
这完全取决于您的终极兴趣方向。本文为您展示了AI在科学发现和生物医学领域的巨大潜力。
当您具备前三层的基础后,可以选择一个垂直领域(如“AI for Science”),通过阅读该领域的综述论文和经典工作来深入。




