01 “数智化”是必然趋势具体来看,人类的生产生活行为一般可以分为三个步骤。第一个步骤叫感知,就是通过耳、鼻、眼等器官,多维度感知这个世界的信息。第二个阶段叫决策,就是利用大脑,基于感知到的信息,决定要干什么事情。第三个是行动,你的手和脚,去做出一个动作。而信息科技的发展,其实就是人类的“懒基因”作用下,不断让机器解放人类生产生活的过程。最早的信息化,机器开始助力人类完成感知工作。1950 年问世的 ENIAC 通用计算机,每秒能进行 5000 次加法运算,而人类每秒极限仅 5 次加法运算,其将人类计算速度提升了 1000 倍,极大地提高了人类感知速度,但决策和行动仍由人类完成。然后到2000年上下的数字化阶段,借助大数据技术与决策式人工智能,机器已能完成部分决策工作。例如谷歌利用 hadoop 框架,每秒可处理上亿条音视频等数据,打破了人类感知速度的局限。同时,人工智能围棋选手 Alphago 战胜柯洁,意味着机器在部分领域可模拟、辅助乃至超越人类行为,人类在部分场景下只需做最终判断与行动即可。**再到当前的数智化时代,机器能在大部分领域模拟甚至超越人类。**像 ChatGPT 在律师资格考试、综合类高考、医疗资格考试、计算机考试等多领域评估模型下,成绩超过 90% 的人类,人类在多数场景下只需付诸行动就行。
02 “数字化”和“数智化”三大区别“数智化” 与 “数字化” 虽仅一字之差,却在目标、资源、技术三方面存在显著区别,具体如下:第一是关键目标不同,“数字化” 阶段,机器主要是有力支撑人类角色与行动,比如通过报表、大屏等形式将梳理、探索的内容展示出来;而 “数智化” 阶段的关键目标在于实现机器对人类行为的高度模拟乃至超越,全面覆盖决策与行动,实现了较大跃升。第二是关键资源不同,数字化企业的关键资源是数据,数智化企业的关键资源则是数据要素。数据作为人工智能发展三要素之一,数据要素与传统数据资源的区别在于它是多元数据的融合,并非局限于单一企业内部数据,而是可通过数据交易所、授权运营等方式从外部获取数据并融合,使其成为关键资源,这也致使数据的采集、存储、管理方式都发生了巨大变化。第三是关键技术的不同,数字化企业侧重于大数据、云计算等技术,数智化企业与之最大的区别在于生成式人工智能,并非仅局限于决策式人工智能。正如黄仁勋在 GTC 2024 所言 “generative is future(生成式才是未来)”。除生成式人工智能技术外,数据要素技术、区块链、互联网、算力网等数智技术也都迎来了新的变革与应用。
03 完成“数智化”转型,企业要做好五项工作****1)构建企业数据智能基础设施数智化企业对基础设施产生了一些新的需求。其一,多元数据的采集、存储与计算出现显著变化,关键在于如何让基础设施支持其快速接入、训练及推理,涵盖内部与外部数据,内部数据有限而外部数据量庞大,需思考怎样高效引入外部数据。其二,关注数据与智能平台的高效连接,主要体现于训练和推理两方面。在训练阶段,要探索如何借助数据基础设施实现加速;在推理方面,则需考虑怎样引入RAG(知识增强检索系统)来弥补模型存在的缺陷。其三,重视异构算力平台的有效调度,涉及CPU、GPU、DPU、APU等类型以及X86、arm、power等体系,以此达成高效计算。 目前业内关于这个领域的发展包括:一是发展应用向量数据库,从而加速模型训练和推理。向量数据库可有效助力各类特征处理工作,进而支撑人工智能模型的训练与推理。随着人工智能不断发展,未来向量数据库有望如关系型数据库一般,成为每个企业的标配。目前国内已有十多款向量数据库。 二是利用湖仓一体,实现多元数据的管理和计算。湖仓一体可便捷实现异构数据的管理与应用,目前已在部分大型金融机构和运营商处落地。 三是智能存储,降低训练数据存储成本。人工智能的训练与推理会产生高额的数据存储成本,致使许多企业难以承受。智能存储作为降低数据存储成本的有效技术手段,目前已被多数云厂商推出。 四是数据流通平台,实现企业内外部的数据融合汇聚。目前,国内以隐私计算为代表的数据流通技术产品已有数百款。五是研发应用数据智能平台,一体化数据处理与模型训练过程。国际上发展势头迅猛,Databricks于去年推出LakehouseAI,且持续收购智能训练公司。Snowflake深度支持英伟达GPU基础设施,诸多平台针对英伟达GPU进行了专门优化。Oracle宣布推出新一代数据、分析和AI平台——Fusion Data Intelligence Platform,并与英伟达建立了更为紧密的合作伙伴协定。 2)打造企业数据智能中台数据中台是在2018年左右,由阿里巴巴从国外引入,并于国内经过演化发展形成的一套理论与技术方法论。然而,依据DIKW(data,information,knowledge,wise)四层衍生体系来分析,仅依靠数据中台是不足够的。在这四层中,除了最底层的data、information两层外,处于上层的knowledge,是在数据智能时代背景下,企业需要着重打造的一层公共服务。基于此,我们做出如下研判。未来企业应建设数据智能中台,主要包含三个部分,一是数据中台,实现数据的汇聚和打通;二是知识中台,从数据中提取知识,对所提取的知识展开进一步归因与分析。 三是智能中台,如何借助中台,将智能相关内容输送至各业务线,避免仅将其置于人工智能部门、算法部门,使其作为独立个体去开展测试工作。 3)实现企业数据智能的治理和安防数据和智能的发展,为前期的治理和安全防框架带来诸多新挑战。例如,亟待建立人工智能的数据治理体系、面向AI的数据质量评价体系、面向人工智能的数据工程体系、大模型生命周期及数据安全意义保护的能力,以及合规合成数据生产内容管理框架等。 4)开发企业的数据智能应用数据智能应用是传统数据应用,在数据智能技术和方法论加持下的升级。其一,应用技术升级。借助智能降低技术门槛,例如大模型赋能的BI工具,通过自然语言交互方式,使BI工具的使用难度降低,推动技术趋向平面化。其二,应用流程变革。运用智能完成应用过程,像利用文生图、文生视频等智能技术重塑营销设计、客户运营工作,这致使大量海报、设计公司受到较大冲击,同时也极大地促进了企业的营销工作。其三,利用智能改变应用业态。比如借助数字人实现定制化的明星播报与关怀,让心仪的明星为自己定制服务,进而提升各类应用的竞争格局。 5)形成企业数据智能的保障机制具体涵盖两方面内容:一个是数据智能的人才培养,主要涉及三类人才,分别是数智管理人才、数智应用人才以及数智专业技术人才。二是企业的组织模式,即怎样推动业务、数据、技术三个部门深度融合。

来源: 数据资产学堂