徐乾宇、胡晓鹏:深入推进AI技术发展,促进中国经济高质量发展

发布者:杨慧倩发布时间:2024-02-02浏览次数:10

AI产业化的发展不仅离不开算法和算力,也离不开良好和庞大的数据演练。因此进一步打通国内数据使用通道,提升大模型演练中数据的可获得性,成为推动AI产业化发展的重要步骤。

作为现代科技的重要组成部分,深入推进人工智能(AI)技术发展,将在我国经济高质量发展中扮演越来越重要的角色。2023年2月ChatGPT问世,标志着AI技术的商业化落地进入全新阶段。随着大数据、云计算、物联网等信息技术的发展,泛在感知数据和通用图形处理器推动,以深度神经网络为代表的AI技术飞速发展,大幅跨越了科学与应用之间的“技术鸿沟”,迎来爆发式增长的新高潮。众所周知,AI是由算力、算法和数据三部分组成。目前,算法较难取得创新,算力核心在于芯片,短期仍有所受限。从某种程度上来说,数据的规模和质量已经成为决定AI发展水平的关键。

OpenAI在2023年11月7日于首届开发者大会DevDay上宣布了GPTs,用户可以通过自定义指令、拓展(模型)的知识边界和下达行动命令,来构建自己的GPT。大模型发展在国外已日趋成熟,在国内则亟待进一步推动。AI产业化的发展不仅离不开算法和算力,也离不开良好和庞大的数据演练。因此进一步打通国内数据使用通道,提升大模型演练中数据的可获得性,成为推动AI产业化发展的重要步骤。

一是充分发挥中国海量数据的规模优势,打通公域和私域数据分割,驱动各类数据共享,在确保数据安全前提下,推动AI对复杂多场景的应用能力。

直到目前,AI技术仍处于发展中阶段,主要障碍是数据规模还不够庞大以及机器人对现实场景切换的应变能力还不够充分的智能化。相对而言,中国拥有超过10亿的网民数量,互联网普及率接近80%,5G基站数近200万个,5G移动电话用户接近5亿。这些基础因素决定了中国拥有强大的数据生产能力,而且数据不仅仅是通过手机、电脑生成,还包括各种各样传统的离线商业活动,如共享单车、医疗扫描、考勤打卡、金融支付、卫星图像等。这意味着,在下一轮新科技竞争中,如果我国能够快速提升数据供给能力、优化数据供给结构,这将筑牢海量数据规模和丰富应用场景的基础优势,极有可能在大规模图形计算、智能数据工程等方面取得重大突破。

比如,国内数据市场如图书数据等,这些数据由于版权原因,仍掌握在部分版权使用者上,或是由于使用规定尚未明确,无法被合理使用。再如,出于数据安全的考虑,公域数据和私域数据以及不同平台的数据尚未完全打通,数据分割势必削弱AI技术产业化的步伐,导致大模型无法获得此类数据。客观而言,大模型部分功能的缺失,并不利于大模型发展升级,也不利于激发AI技术开发的积极性。因此,打通地区和平台数据分割,促进数据市场一体化发展,才能助力大模型演练,达到AI推动经济高质量发展的目标。

二是深化数据资源开发,聚焦AI服务实体经济领域,依托龙头企业打造数据、知识、算法“三位一体”的关键节点,增强实体经济智能化场景效能。

AI全域变革图景展望:跃迁点来临(2023)》报告显示,截至2023年6月底,全球AI企业共计3.6万家,中美企业数量名列前茅。美国AI企业数量约1.3万家,在全球占比达到33.6%,中国占比为16.0%。另据胡润研究院发布的《2023全球独角兽榜》,美国以666家独角兽企业领先,占全球独角兽总数的49%。中国以316家位居第二,中国独角兽数量比后面15个国家加在一起还要多。因此,在AI创新方面,中国和美国同样跻身全球第一梯队。

但在应用场景上,中国的AI主要面向推动工业4.0和“智能制造”,重点集中在工业制造、物流和零售等。这里有两个数据充分体现这一点,如2022年中国工业机器人装机量占全球比重超50%,稳居全球第一大工业机器人市场。再如,2022年中国在AI相关半导体私人投资的金额为1.02亿美元,是美国的1.75倍。

从这个意义上讲,促进中国AI技术的发展,必须紧紧围绕赋能实体经济这一核心目标。为此,进一步深化各省市《数据条例》的有关配套政策,依托AI独角兽企业较多的重点城市如北京、上海、深圳、广州、杭州等,赋权研究探索出台数据流通等专项法规,对数据关键技术、标杆生产制造场景等予以支持。积极探索AI等技术赋能产业,如在电商领域,目前“AI+电商”的相关技术主要已开始应用于AI选品、图文和视频广告素材制作/广告语智能输出、广告智能投放、智能客服回复等方面。以亚马逊为例,已通过AI赋能跨境电商的选品、营销和物流等多个环节。因此,我国可借助自身AI产业优势,积极推动AI和跨境电商等新业态之间融合。

三是夯实数据领域标准,高质量发展需要相应的高标准作为支撑,发挥标准引领支撑作用,推动标准化与科技创新互动发展,加强关键技术领域标准研究。

DEPA(数字经济伙伴关系协定)中已明确提出,缔约方应努力促进采用支持可信、安全和负责任使用AI技术的道德和治理框架。AI治理的重要组成就是数据治理和标准制定。全球AI治理框架尚未明确,这是个全新的规则领域,也是中国及早加入的机遇。AI标准化为产品和服务质量提供保障,并保障信息安全,有效减少AI技术带来的信息安全、个人隐私等问题。为此,我国2020年就印发了《国家新一代AI标准体系建设指南》,构筑了AI标准体系,形成标准引领AI产业发展的新格局。此后,针对AI计算平台的国家标准启动编制,并在生物特征识别、智能汽车等AI应用领域发布了多项国家标准。国家网信办2023年7月公布《生成式AI服务管理暂行办法》,统筹安全与发展,对生成式AI研发及服务做了明确规定,保障AI的良性发展和创新。

但目前,我国在硬件方面仍面临着不同场景下的AI硬件指令集、微架构设计不同的问题,亟待统一的规范标准。AI安全基础标准、关键应用方向安全保护标准、机器学习模型标准乃至硬件虚拟接口、开发框架兼容规范等标准,都亟待进一步规范。此外,AI编译工具之间的融合性有待提升。因此,上海应发挥先行先试优势,加强与ISO等国际标准组织的合作,参与国际标准制定,并围绕试点示范项目,探索我国AI标准培育,加快AI训练数据等相关标准文件的发布,稳步扩大规则、标准等制度型开放,为中国式现代化开辟新路。

总而言之,数据是新型生产要素,是数字化、网络化、智能化的先决条件。AI是数据密集型行业,也是新一轮科技革命和产业革命的驱动力量,积极推动数据的安全有效训练、管理和使用,全面加快数据融入生产、分配、流通、消费和社会服务管理等各环节,是做大做强我国AI产业的基本路径。实践中,2023年2月中共中央、国务院也印发了《数字中国建设整体布局规划》,强调“到2025年将基本形成横向打通、纵向贯通、协调有力的一体化推进格局,数字中国建设取得重要进展;到2035年,数字化发展水平进入世界前列”。此后,全国各地立刻响应,掀起了AI产业快速发展的浪潮。

公开数据显示,截至目前我国在空间上已经形成长三角、京津冀、珠三角三大AI产业集聚发展区。特别是在新一轮生成式AI热潮中,全国已经出现了106个大模型,其中北京的大模型公司数量和研发数量均占据“C位”,多达54个;上海在AI算力方面积累了优势;深圳、广州、杭州、成都等城市也都有多个大模型公司。

我们有充分理由相信,在数字化变革的推动下,中国有望在AI领域获得率先突破,由AI技术发展的产业化应用所迸发的强大新质生产力,将促进我国未来经济和社会的智慧化发展,助力中国式现代化和经济高质量发展的目标愿景。

 

来源:第一财经01-29

作者:徐乾宇上海社会科学院世界经济研究所助理研究员胡晓鹏上海社会科学院世界经济研究所副所长、研究员