建大坝、修公路时,工程师常要面对一个关键问题:粗粒土(石子、砂砾等)在压力下会怎么“变形”?传统方法靠三轴压缩试验测数据,但这类试验成本高、耗时长,且样本有限,很难直接用来训练AI模型做预测。我国科研团队在《Frontiers of Structural and Civil Engineering》上发表的一项研究,用“时间序列生成对抗网络(TimeGAN)+预训练策略”的组合,让数据少也能精准预测粗粒土的变形曲线,为工程设计省下大量时间和成本。

传统方法的“卡脖子”难题:数据少、成本高

粗粒土是堤坝、道路等大型工程的基础材料,掌握其变形规律(比如轴向应变和体积应变的关系曲线)对保障结构安全至关重要。过去,工程师主要靠三轴压缩试验获取数据——把土样放进仪器里加压,记录不同压力下的变形情况。但这类试验一次耗时数天,且样本量有限(团队仅收集到335组有效数据),根本不够训练高精度的AI模型。

TimeGAN:给数据“生宝宝”的AI复印机

为解决“数据饥荒”,团队请出了“时间序列生成对抗网络(TimeGAN)”。这个AI像“数据复印机”,能学习真实试验数据的规律,生成大量“以假乱真”的模拟数据。比如,它能根据已有土样的粒径分布、干密度等特征,“造”出更多类似条件下的变形曲线,把训练数据量从335组扩展到数千组。

但生成的数据靠不靠谱?团队用“特征重要性分析(SHAP)”来验证——就像给数据做“体检”,检查生成数据的关键特征(如粒径分布、围压等)是否和真实数据“神似”。结果发现,生成数据的特征重要性排序和真实数据几乎一致:粒径分布(PSD)对变形影响最大,围压、干密度次之,而容器尺寸等影响很小。这说明TimeGAN生成的数据质量高,能“以假乱真”辅助模型训练。

预训练策略:让AI“先学通用知识再专攻”

不过,直接用生成数据训练模型效果并不好——毕竟是“模拟”的,和真实数据有细微差异。团队又引入“预训练策略”:先让AI在生成数据上“学通用知识”,再用真实数据“微调”,就像人先学基础课再学专业课。实验显示,这种方法大幅提升了模型性能:平均绝对误差(MAE)从0.247降到0.2219,决定系数(R²)从0.8747升到0.9155,预测的变形曲线和真实试验结果几乎“贴”在一起。

应用价值:从实验室到工程的“快速通道”

现在,这套AI模型能快速生成粗粒土的轴向应变-体积应变曲线,工程师不用再等数天做试验,输入土样的基本参数(如粒径分布、干密度),秒级就能得到变形预测结果。这对堤坝选址、公路地基设计等工程意义重大——既能缩短设计周期,又能降低试验成本。

未来:挑战与拓展

研究也指出不足:目前数据主要来自最大粒径60mm的粗粒土,更大粒径的土样数据极少,模型泛化能力受限。团队计划用“迁移学习”把现有模型的知识“迁移”到更大粒径的土样上,同时结合地质领域知识,让模型更“懂”粗粒土的物理特性,提升解释性。

来源: FrontCIVlL