AI从田间到天空，蚂蚁翻山越岭扎根科技

日期：2023-07-12 12:05:50 / 人气：676

从征服天空的宫殿到走出大山的就业工具。”
作者/IT时报记者孙艳
编辑/孙艳
3年，靴子落地，蚂蚁集团完成整改。
蚂蚁在调整中前行，但翻山越岭从未改变的是科技的核心基因。过去三年，一年一度的世界人工智能大会(WAIC)是蚂蚁集团AI技术的“大奖”，也见证了蚂蚁“根技术”的进化。事实上，三年前，在筹备IPO之前，蚂蚁集团就明确表示自己是一家科技公司，而不是金融公司。
在WAIC 2023上，一半的国产大模特将“秀肌肉”，或将是“百模大战”的开始。然而，蚂蚁找到了另一种方法。当AIGC被频繁的幻觉、不可控的结果、隐私安全、歧视和偏见困扰时，蚂蚁祭出了一招“解毒”AI的妙招:AI安全检测平台“蚂蚁健2.0”，利用生成式AI能力检测生成式AI模型。
在去年的WAIC 2022上，蚂蚁展示了隐私计算、区块链和图形计算这三项“基础技术”。在今年的WAIC 2023上，这三项“根技术”开花结果，“蚂蚁金服”升级为“蚂蚁金服2.0”，增加了AIGC安全检测；隐私计算“隐语技术栈”开源升级，推出隐语框架1.0，开源国内首个金融安全TEE解决方案“Hyperenclave”；升级了蚂蚁区块链隐私协作平台AntChain FAIR的新架构，引入了以零知识证明(ZKP)为核心的可验证计算技术，对Web3技术的攻击更进了一步。
大型“安全体检软件”
“百模大战”开启了中国的AI追赶竞赛，这并不是一件坏事，但当人类开始依赖大模型作为生产工具的时候，如果大模型胡说八道，谁来评判它的对错，它产生的虚假数据是否会污染数据池？
在WAIC 2023上，蚂蚁集团联合清华大学发布了AI安全检测平台“蚂蚁金服2.0”，利用生成式AI能力检测生成式AI模型，可识别数据安全、内容安全、技术伦理三大类数百种风险，覆盖表单、文本、图像等数据和任务类型。是业内首个实现行业级应用的全数据AI安全检测平台。
在C展台，《IT时报》记者看到了本次大会的“镇馆之宝”——“蚂蚁金服2.0”。左边的“蚂蚁健机器人”自动生成海量测试集，并交互诱导右边的大模型。每分钟可调用10多种不同难度系数的对策，生成30多道诱导题。很像一个24小时的“安全黑客”，在一个大模型里找毛病。它比“安全黑客”更智能的地方在于，它会同时实时自动地检测和计算大模型的答案，从近200个子纬度中找出大模型的弱点和安全问题，最终生成大模型的安全体检报告。
“生成式大模型是一种‘深度黑盒’技术。这种AI对AI的评价是在互相学习，就像生成型考官对生成型运动员的评价一样。在对抗中，双方能力互相提升，进一步提升整个行业的AI安全水位。”蚂蚁集团大安全事业群技术部总裁李俊奎说。
另一个硬核能力是，“蚂蚁金服2.0”集成了可解释性检测工具，从完备性、准确性、稳定性等7个维度和20多个评价指标对AI系统的解释质量进行量化，帮助用户更清晰地验证和优化可解释性方案。
“蚂蚁指南2.0”整合了蚂蚁近10年的可信AI实践和1000多项可信AI专利，支持零编码评测。开发者通过API接口将AI模型连接到Ant Expert，就可以一键识别和挖掘模型漏洞。
蚂蚁集团宣布“蚂蚁向导2.0”全面开放，为全球开发者提供免费的AIGC安全、AI可解释性和AI健壮性测试工具，可服务于数字金融、教育、文化、医疗、电子商务等领域的大型复杂业务场景。
当然，大模式对错的标准如果只是“一家之言”，是没有说服力的。因此，中国信通院、上海人工智能实验室、武汉大学和蚂蚁集团联合发起了AIGC可信倡议。该倡议在数十家公司的参与下，围绕人工智能可能引发的经济、安全、隐私和数据治理问题，提出构建AIGC可信发展的全球治理合作框架，通过采用安全可靠的数据资源、技术框架、计算方法和软件平台，提高AIGC的可信工程能力，最大程度地保证生成式AI的安全性、透明性和可解释性。
云计算的下一步是天空计算。
WAIC 2022的八大宝藏之一是另一个蚂蚁产品:技术栈，一个可信的隐私计算行话。技术栈已经开发了六年。今年，蚂蚁开放了隐私计算技术栈中的两大产品，分别是“argot开源框架1.0”和国内首个金融安全TEE方案“HyperEnclave”。
argot的开源框架是argot技术栈中的计算引擎层，HyperEnclave是其可信基础。技术栈是一只蚂蚁的自研，已经积累了一千多项专利。它集成了argot开源框架、Occlum TEE开源操作系统、HyperEnclave等隐私计算技术产品，孵化了可信秘密计算(TECC)等隐私计算新技术。两种新产品的开源特性有望在隐私计算的易用性和普遍性方面带来飞跃性的改进。
暗语框架于去年7月首次开放，用了一年时间升级到1.0版本，更好的实现了“拎包入住”的服务。新版本有三大优势:解决了与第三方系统的互操作问题，打造了黑白盒的全栈互操作，推出了“开箱即用”的轻量级部署体验包，降低了隐私计算的应用门槛。
TEE是隐私计算的技术路线之一，被认为是数据安全和隐私保护计算最有效的技术手段。这种开源的HyperEnclave的优势在于安全性和兼容性。支持国内外主流CPU硬件平台，提供统一的TEE抽象，核心代码经过形式化验证。同时符合国内自研要求，有大型商业场景落地经验。
一些技术“软基础设施”也取得了重要进展。IEEE(电气和电子工程师协会)发布了首个国际标准IEEE2952-2023《可信执行环境安全》。该标准由蚂蚁集团牵头，制定了基于TEE技术的安全计算系统技术框架。中国信通院、中国移动、中国联通、中国电信、蚂蚁集团、洞察科技联合发布《隐私计算跨平台互联开放协议第2部分:SS-LR》。该协议将构建一个更加开放、透明、安全的隐私计算互联平台，保护数据安全。
“云计算的下一步将是天空计算”。在蚂蚁集团副总裁兼首席技术安全官陶伟看来，隐私计算可以摆脱云的束缚，实现云与云之间的互通。计算、大数据、数据元是必经的三大阶段，核心是降低数据流和安全的成本。
工业的数字化是确定性的最大机会。
在一个不确定的时代，每个人都在寻找一个确定的机会。“产业数字化是数字经济的核心领域，也是确定性最大的机会。”蚂蚁集团高级副总裁蒋在2023上表示。
蚂蚁区块链(Ant Chain)一直在挖Web3的一条路。在今年的WAIC 2023上，蚂蚁链宣布隐私协作平台AntChain FAIR全新架构升级，引入以零知识证明(ZKP)为核心的可验证计算技术，从可信数据流扩展到计算过程、数据属性和身份的可验证性。
目前，FAIR已经在杭州数字交换、桂树交换等多个数据交换中得到应用。
零知识证明被认为是未来五年内Web3最关键的技术之一，这意味着证明者可以在不向验证者提供任何有用信息的情况下说服验证者某个断言是正确的。与在保护数据隐私的基础上强调数据分析和计算的隐私计算相比，零知识证明的特点是“可验证性”。
元宇宙不能建在沙滩上，AI大模型训练、身份验证、数据流、资产交易、链下协作也要基于全流程可信，这将加速Web3从数字世界向更复杂的工业场景渗透。
零知识证明的关键环节是“证明生成阶段”，即对数据、身份、计算过程等生成一个“证明”。通过软件算法的优化，蚂蚁链的“证明生成”端到端加速到原来基线的2.8倍。
蚂蚁链作为国内最早的Web3技术制造商，在Web3技术领域完全自主可控，区块链、隐私计算等授权专利全球第一。
艾走进场地
AI训练师走出大山
对于即将到来的人来说，蚂蚁扎根多年的“根技术”可能是晦涩难懂的。但近年来，蚂蚁始终专注于实体经济，尤其是帮助小微群体创造更大的价值，这是普通人都能亲身体验到的AI。
艾走进了田野。以前农村网贷的征信是靠两条腿走路的。现在，网商银行基于“AI+遥感”技术开发的大山雀系统，首次将卫星遥感技术应用于农村金融，解决农民无需抵押、担保、提交纸质材料的信贷问题。在贷款授信过程中，大Tit系统通过深度学习等人工智能技术对卫星图像进行观察分析，识别农作物的种植面积、品种、生长情况，预测产值，从而给出合理的额度。目前，大山雀系统已覆盖31个省、市、自治区，服务120多万种植户。
来自甘肃积石山县的人工智能培训师张娟走出了县城。和她一样，更多的AI培训师来到WAIC这个世界舞台，直面大模企业。AI越来越智能的背后，少不了AI训练者的循序渐进的教导，将图片、语言、文本、视频等原始数据标注成AI能理解的结构化语言。
2019年，蚂蚁集团、蚂蚁公益基金会、中国妇女发展基金会联合发起“数字木兰|爱豆计划”。截至2022年底，该计划已支持陕西、山西、甘肃、贵州、宁夏等地建立了17个县级数字就业中心，帮助4000人在当地找到工作，成为“人工智能培训师”，其中女性超过60%。相关数字就业中心开展的标签业务已覆盖200多个具体应用场景，年数据标签量过亿，多家中心成为当地最大的就业企业。
从征服天空的技术到走出大山的就业工具，AI的意义在于通过自我学习成就社会，企业也要从自我调整中跨越高峰和低谷，创造更多的机会和未来。
排版/纪佳颖
图/蚁族
来源/IT时报微信官方账号vittimes
E N D "

作者：腾越娱乐

AI从田间到天空，蚂蚁翻山越岭扎根科技

新闻资讯 News

案例展示 Case

现在致电 5243865 OR 查看更多联系方式 →

现在致电 5243865 OR 查看更多联系方式 →