MDAnalysis中文教程-Analysis
分析
MDAnalysis的analysis模块提供了进行数据分析所需的工具。该软件包中包含了多种分析功能。这些分析涵盖了从标准算法(例如计算均方根量)到独特的算法(如路径相似性分析)等各类内容。
通常,这些综合分析是由众多研究人员完成的,他们使用该代码来进行自己的研究工作。如需获取更多参考文献和引用信息,请查阅各个模块的文档或相关的用户指南教程。
如果您需要的是MDAnalysis中尚未提供的功能,那么有几种方法可以自行编写分析程序。
如果您想在MDAnalysis中并行运行自己的脚本,这里有一篇关于如何使您的代码实现并行化的教程。
导入依赖
分析模块默认没有导入。为了使用它们,你需要分别导入它们。如:from MDAnalysis.analysis import align
注:一些分析模块需要额外的Python包或程序。例如:encore需要scikit-learn;hole需要HOLE程序。
对齐和RMS拟合
MDAnalysis.analysis.align和MDAnalysis.analysis.rms模块包含了用于对结构进行对齐、对轨迹进行对齐以及计算均方根量等的函数。
对齐演示包括“将一个结构与另一个结构对齐”、“将一条轨迹与自身对齐”以及“将一条轨迹与参考轨迹对齐”。从对齐中生成平均结构的另一个示例在“计算轨迹上的均方根波动”中有所展示。通常情况下,为了使 RMSD 和 RMSF 值具有意义,轨迹需要进行对齐处理。
注:这些模块采用快速 QCP 算法来计算两个坐标集之间的均方根距离(RMSD)The05 以及能使该距离最小化的旋转矩阵 R LAT09。在使用这些模块时,请引用上述参考文献。
距离和接触
MDAnalysis.analysis.distances 模块提供了用于快速计算距离的函数。这些函数主要接收坐标数组作为输入。
如果两个残基中的原子处于一定距离范围内,那么这两个残基就可以被认定为相互接触。通过分析蛋白质在某一轨迹中保留的接触比例,与参考框架或结构中的接触数量进行比较,可以深入了解折叠过程和结构域的移动情况。
MDAnalysis.analysis.contacts 包含一些函数和一个类,用于分析轨迹中天然接触点所占的比例。
轨迹相似性
一个包含N个原子的分子动力学轨迹可以通过一条路径在3N维的分子构象空间中进行描述。MDAnalysis包含了多种算法来比较不同轨迹的构象集合。其中大部分算法位于MDAnalysis.analysis.encore模块中(TPB+15),它们通过比较估计的概率分布来衡量相似性。“比较轨迹的几何相似性”教程会比较构象转换路径中各结构对之间的RMSD。MDAnalysis.analysis.encore还包含使用构象簇的相似性或在降维空间中的相似性来评估轨迹构象收敛性的函数。
结构
体积分析
降维
一个包含N个原子的分子动力学轨迹可以被视为一条贯穿3N维分子构象空间的路径。然而,要从如此高维的空间中提取重要的动态信息或比较轨迹的相似性仍然颇具挑战性。不过,集体运动和具有物理意义的状态通常可以通过对轨迹所探索的构象空间进行低维表示来有效地描述。MDAnalysis实现了两种降维方法。
主成分分析是一种常见的线性降维技术,它将轨迹中每一帧的坐标转换为一组正交向量的线性组合。这些向量被称为主成分,并且它们是按照一定的顺序排列的,即第一个主成分能解释原始数据中最多的方差(也就是轨迹中最大的无相关运动),而后续的每个主成分所解释的方差则越来越少。轨迹坐标可以转换到由这些主成分构建的低维空间(基本子空间)中,以便进行构象比较。您的轨迹还可以投影到每个主成分上,以可视化由该成分所描述的运动。
扩散映射是一种非线性降维技术,它将每个帧的坐标嵌入到一个较低维的空间中,使得低维空间中每个帧之间的距离代表它们的“扩散距离”或相似度。它将每个点与其邻近点之间的相似性局部信息整合到内在流形的全局几何结构中。这意味着该技术不适用于那些构象状态之间的转换未得到充分采样的轨迹(例如复制交换模拟),因为这些区域可能会变得相互分离,从而无法近似出有意义的全局几何结构。与主成分分析(PCA)不同,低维空间中的各分量与原始原子坐标之间没有明确的映射关系;也没有立即可用的特征向量的物理解释。
聚合物和膜
MDAnalysis 软件具备多种专门针对聚合物、膜结构以及膜蛋白的分析功能。
氢键分析
“MDAnalysis.analysis.hydrogen_bonds”模块提供了用于在“Universe”中查找和分析氢键的方法。
翻译https://userguide.mdanalysis.org/stable/examples/analysis/README.html