西安数据标注产业如何跑出“加速度”

2025-05-20ASPCMS社区 - fjmyhfvclm

标注员正在计算机集群前专注处理数据流。

当人工智能技术加速重构产业版图,数据要素作为数字经济时代的核心引擎,正在西安孕育新的增长极。2025年西安市政府工作报告将“培育数字产业经营主体”列为核心工作要求之一,明确提出大力发展RISC-V开源芯片、数据标注、人工智能大模型等数字产业。作为AI产业的“基石”,数据标注产业如何乘势而上?记者近日走访西安产学研一线,探寻这条新兴赛道的发展密码。

政策赋能

数据标注站上产业风口

“数据是AI的‘粮食’。”工信部信息通信经济专家委员会委员、中国工业经济学会人工智能制度建设专业委员会副主任委员盘和林在此前受访时给出了形象的比喻。他指出,AI发展必须要有经过人工加工的数据支持,因此数据标注可以看作AI技术的基础产业。

行业数据显示,2023年我国数据标注市场规模已达60.8亿元,同比增长19.69%,其中计算机视觉和智能语音标注占比超85%。随着多模态大模型爆发,高质量标注需求呈现指数级增长。

“西安具备发展数据标注的先天优势。”西部数字经济研究院院长张鸿指出,本地高校密集的科教资源、持续开放的政务数据,以及承接东部产业转移的区位条件,正推动西安形成“技术+人才+场景”的良性生态。

据了解,目前中软国际科技服务有限公司、陕西淘丁实业集团有限公司、西安金慧科技有限公司等大中型企业已在西安形成数据标注产业的规模化服务能力,全市相关企业总量已超20家。

转型样本

从“劳动密集”到“知识赋能”

近日,记者来到位于西安市南二环老三届世纪星大厦的陕西淘丁实业集团的标注工作区,百余位标注员正在计算机集群前专注处理数据流。

“作为AI训练的基础工作,数据标注是构建人工智能基础设施的核心工程。”淘丁集团CEO苏斌指着企业研发的“淘丁精标云”数据标注平台界面介绍说,该平台已形成覆盖图片、语音、文本、视频的全模态数据采集标注能力,通过场景化训练数据集生产服务,为行业提供定制化数据解决方案,有效支撑自动驾驶、智能客服等AI模型的研发迭代。

“我们现在处理的已不仅是基础分类,更多的是需要融合计算机视觉、自然语言处理等多学科知识的高价值数据工程。”苏斌透露,经过智能化转型,企业已与百度、字节跳动、小红书等头部平台建立深度合作,日常处理项目量级超百万,部分数据达千万级。

这家本土企业的转型轨迹,恰是数据标注行业变革的缩影。2018年淘丁集团“入局”时以劳动密集型标注为主,如今已聚焦自动驾驶、智慧医疗等前沿领域,实现向知识密集型服务的跨越式转变——这种转变,适逢西安市将数据标注纳入产业强市重点工程战略部署的政策机遇。

专家建言

“三位一体”构造核心竞争力

面对目前全国7个国家级标注基地年处理17万TB数据的规模效应,西安如何实现差异化突围?

张鸿建议,实施“筑巢引凤”战略。“可在长安大学城规划标注产业园区,依托高校资源打造‘产学研用’闭环。”他强调,当前的发展要务,是尽快让数据标注产业在西安形成聚集区。“根据其他城市数据标注产业的发展情况以及数据标注自身的特点来看,数据标注产业往往对人才的要求很高。”张鸿表示,西安相关专业毕业生资源充沛,若能留下这些“生力军”并定向培养标注工程师,则有望在这座科创之城、机遇之城快速形成人才优势,进而推动集聚效应。

苏斌提出,可通过构建“标准制定+场景应用+人才培养”三位一体的产业生态体系,将西安在科教资源、算力基础、应用场景等方面的优势转化为核心竞争力。“比如,可考虑建立数据标注质量认证中心,打造涵盖自动驾驶、智能制造、智慧医疗等领域的‘西安特色高质量数据集’,力争尽快形成规模化产业集群;还可联合西交大、西电等高校设立数据要素重点实验室,打造具有全国影响力的行业标准。”

在政策红利与AI需求的双重驱动下,西安数据标注产业正显现出强劲动能。正如业内人士所言,在AI2.0时代,数据标注已从基础服务升级为价值创造的枢纽环节。当千年古城与前沿科技深度交融,西安正通过激活数据要素潜能,将标注这项“数字时代的精微艺术”,转化为培育新质生产力的战略支点,为数字经济高质量发展注入强劲动能。

(记者 刘宁 李猛 文/图)

全部评论