作者:段跃初 黄湘红

在当今科技飞速发展的时代,人工智能无疑是最具影响力的领域之一。人工智能的发展不断为我们带来惊喜和挑战,而一种构建神经网络的新方法——柯尔莫戈洛夫-阿诺德网络(KAN),正逐渐引起人们的关注,为人工智能的未来带来了新的可能性。

如今,几乎所有类型的人工智能,包括用于构建大型语言模型和图像识别系统的人工智能,都包含被称为多层感知器(MLP)的子网络。在 MLP中,人工神经元被密集地排列在相互连接的“层”中。每个神经元内部都有一个称为“激活函数”的东西,它接收一堆输入,并以某种预先指定的方式将它们转换为输出。

然而,尽管现代人工智能拥有强大的力量,但它们也充满了神秘。MLP 就像一个黑盒子,其内部的工作机制很难被理解。例如,在图像识别等复杂任务中,逆向工程几乎是不可能的。这给我们理解人工智能为什么会产生某些输出带来了巨大的挑战,也使得我们难以验证它们的决策和探测偏差。

为了解决 MLP 的难题,由麻省理工学院研究人员领导的一个研究小组提出了一种新的神经网络构建方法——柯尔莫戈洛夫-阿诺德网络(KAN)。KAN 的基本要素在上世纪 90 年代就已经被提出,但麻省理工学院领导的团队将这个想法向前推进了一步。

KAN 的工作方式与传统的神经网络有所不同。在内部,新的神经元简单地总结他们的输入并产生一个输出,而不需要额外的隐藏操作。与 MLP 神经元中的激活函数不同,KAN 神经元之外的每个简单函数都需要输入一个数字,然后输出另一个数字。现在,在训练过程中,KAN 神经元不再像 MLP 那样学习单个的权重,而是学习如何表示每个简单函数。

这种简化的方法使我们更容易了解神经网络是如何产生它们所做的输出的。初步证据还表明,随着神经网络的放大,KAN 的精确度比由传统神经元构建的网络提高得更快。

KAN 的可解释性是其最大的优势之一。通过引入更简单的可学习函数,在输入进入神经元之前对其进行转换,KAN 神经元之外的简单函数更容易解释,从而可以重建整个 KAN 正在学习的函数的数学形式。这有助于我们验证人工智能的决策,甚至探测偏差。

研究小组对 KAN 进行了实证测试,并对一些 KAN 进行分析,以证明它们的解决问题的能力可以被人类解释。例如,在科学相关任务(比如学习近似物理相关函数)上,KAN 表现出了比 MLP 更高的精确度。

虽然还处于早期阶段,但 KAN 的工作正引起人们的关注。GitHub 页面已经涌现出来,展示了如何将 KAN 用于多种应用,如图像识别和解决流体动力学问题。这表明 KAN 具有广泛的应用前景,有望在未来的人工智能领域发挥重要作用。

尽管 KAN 具有诸多优势,但它也面临着一些挑战。与 MLP 相比,训练一个 KAN 需要更多的时间和计算能力,这限制了 KAN 在大规模数据集和复杂任务上的应用效率。然而,研究人员认为,更高效的算法和硬件加速器可能会有所帮助。

随着技术的不断进步,KAN 可能会变得更加高效和实用,为我们解决更多复杂的问题。同时,KAN 的可解释性也将为人工智能的发展带来新的方向,使我们能够更好地理解和控制人工智能。

总之,柯尔莫戈洛夫-阿诺德网络(KAN)作为一种构建神经网络的新方法,为人工智能的发展带来了新的希望。它的可解释性、解决问题的能力和广泛的应用前景,使其成为了人工智能领域的一个重要突破。虽然 KAN 还面临着一些挑战,但我们有理由相信,在未来的日子里,KAN 将不断发展和完善,为我们创造一个更加智能和可理解的世界。

来源: 科普文讯