今年的《政府工作报告》指出,要持续推进“人工智能+”行动,将数字技术和制造优势、市场优势更好结合起来,支持大模型广泛应用。
数据,特别是高质量、多模态、精标注的数据,是人工智能发展的不竭动力。中国在人工智能领域取得的成果与数据工作的创新实践密不可分。
“高质量数据集是经过采集、加工等数据处理,可以直接用于开发和训练人工智能模型,能够有效地提升模型性能的高质量数据集合。”国家数据局副局长余英7月22日在新闻发布会上介绍,高质量数据集分为三类:通识类、行业通识类、行业专识类。目前,按照通识、行业通识和行业专识的细分类别,国家数据局将全面加速高质量数据集建设和应用落地,进一步推动数据要素市场化、价值化,为培育新质生产力提供坚实的数据支撑。
据了解,国家数据局开展生态培育专项行动,一是组织开展高质量数据集典型案例征集和示范推广,挖掘医疗、工业、交通等重点领域标杆实践;二是定期举办技术交流活动,围绕数据标注、合成、高质量数据集建设方法论等开展深度研讨;三是搭建常态化供需对接平台,促进数据供给方、技术提供方、场景应用方精准匹配。同时,指导合肥、成都等7个城市建设数据标注基地,先行先试探索数据标注产业发展经验。截至今年上半年,7个数据标注基地建设数据集有524个,规模超过29PB,服务大模型163个。
业内人士认为,数据决定人工智能的上限,而算力则决定人工智能的下限。近年来,贵州大力推进“东数西算”,加快从以前的“以存为主”,转向“存算一体、智算优先”,全力打造面向全国的算力保障基地。据了解,华为云全球最大智算中心、腾讯、网易、美的的算力“大本营”均坐落于此。
贵州省人民政府副省长罗强在此次发布会上介绍,贵州省在建和投运的重点数据中心已经达到48个,其中大型数据中心就有28个,存储能力达到25EB。如果一部高清电影文件以5GB来算,25EB相当于可以存50亿部高清电影。另外,贵州省智算规模已经达到85EFLOPS,智算占比超过98%;出省带宽超过6万Gbps,落地建设全球首条400G算力通道,可以直接连通全国42个主要城市,到北京的网络延迟大概16—17毫秒;为全球50多个国家和地区、20多万用户提供了云渲染算力服务,比如《哪吒2》的渲染工作都在贵州完成。
“我们还在加快华为云、美的、网易等数据中心、智算中心建设,华为云在贵州正在建设第三个大型园区。”罗强表示,接下来,贵州还要坚定不移加快算力基础设施建设,把光网络搞得更快更稳,当前的重点是推进“东数西算”南部大通道建设,同时还要把数据中心电费降下来、绿电比例提升上去。把“贵州算力券”政策优化落实到位,重点满足大模型训练、动漫渲染、电竞等产业的算力需求。
炒股入门与技巧提示:文章来自网络,不代表本站观点。