修大坝时,堤坝下的粗粒土(石子、砂砾等)在压力下会“缩成一团”还是“散架”?工程师要精准预测这种变形规律,过去只能靠费时费钱的三轴压缩试验——把土样放进仪器加压,记录变形数据,一组试验少则数天,多则数周。我国科研团队在《Frontiers of Structural and Civil Engineering》上发表的一项研究,用AI“造数据”加“预训练”的组合拳,让数据少也能精准预测粗粒土变形,为工程设计按下“加速键”。

传统难题:数据少、成本高,AI“巧妇难为无米之炊”

粗粒土是堤坝、公路等工程的“骨架”,掌握其变形特性(比如轴向应变和体积应变的关系曲线)是保障结构安全的关键。但获取这些数据全靠三轴压缩试验:取土样、加压、测变形,一套流程下来,团队仅收集到335组有效数据。数据量太少,AI模型根本“喂不饱”,直接影响预测精度——这成了工程领域的“数据饥荒”。

TimeGAN:给数据“生娃”的AI“复印机”

为解决“没数据”的问题,团队请出了“时间序列生成对抗网络(TimeGAN)”。这个AI像“数据复印机”,能“偷学”真实试验数据的规律:比如,它会观察真实土样的粒径分布、干密度、围压等参数与变形曲线的关系,然后“生成”大量“以假乱真”的模拟数据。就像用一张真实照片训练AI,它能生成成百上千张风格相似但细节不同的“假照片”,且肉眼难辨真假。

但生成的数据靠不靠谱?团队用“特征重要性分析(SHAP)”给数据“做体检”:检查生成数据中,哪些特征(比如粒径分布、围压)对变形的影响最大。结果发现,生成数据的特征重要性排序和真实数据几乎一致——粒径分布(PSD)对变形影响排第一,围压、干密度紧随其后,而容器尺寸等“打酱油”的特征影响很小。这说明TimeGAN生成的数据不是“胡编乱造”,而是“神似”真实数据。

预训练策略:AI“先学通用知识,再专攻”

不过,直接用生成数据训练模型效果并不好——毕竟是“模拟”的,和真实数据有细微差异。团队又想了个办法:“预训练策略”。就像人学英语,先背通用单词(预训练),再针对专业领域学术语(微调)。AI先在生成的大量模拟数据上“学通用规律”,再用少量真实数据“调整参数”。实验显示,这种方法让模型性能大幅提升:预测体积应变的平均绝对误差(MAE)从0.247降到0.2219,决定系数(R²)从0.8747升到0.9155,预测的变形曲线和真实试验结果几乎“贴”在一起。

应用价值:工程设计的“秒级助手”

现在,工程师只要输入土样的基本参数(如粒径分布、干密度),AI模型就能秒级生成轴向应变-体积应变曲线,不用再等数天做试验。这对堤坝选址、公路地基设计意义重大——既能缩短设计周期,又能降低试验成本。

未来:挑战与方向

研究也“自曝短板”:目前数据主要来自最大粒径60mm的粗粒土,更大粒径的土样数据极少,模型“见得少”,泛化能力受限。团队计划用“迁移学习”把现有模型的知识“迁移”到更大粒径的土样上,同时结合地质领域知识,让模型更“懂”粗粒土的物理特性,提升解释性。

来源: FrontCIVlL