热门赛道丨AI服务器狂飙:从芯片到应用,谁是千亿市场真赢家?
AI服务器(AI Server)是一种专门为运行人工智能工作负载而设计的高性能计算服务器。与传统服务器相比,AI服务器在硬件配置、计算能力和数据处理能力方面进行了优化,以满足AI训练和推理任务对资源的高需求。
AI服务器具有多项显著特点,首先体现在其卓越的高性能计算能力上。它通常搭载多颗高性能CPU以及多个GPU,并支持GPU加速,尤其适用于深度学习和机器学习等计算密集型任务。为了应对大模型训练对资源的高需求,AI服务器还配备TB级内存和高速SSD或NVMe存储,确保海量数据的高效读写与处理。在网络连接方面,AI服务器支持InfiniBand和PCIe 4.0/5.0等高速互联技术,显著提升GPU之间的通信效率,同时具备良好的扩展性,方便根据需要增加GPU、内存或存储资源。此外,这类服务器在软件层面也高度兼容主流AI框架,如TensorFlow、PyTorch和MXNet,极大地方便了开发者进行模型的训练与部署。为了保障长时间稳定运行,AI服务器通常配备先进的散热系统(如风冷或水冷),并通过能耗管理优化整体功耗与性能的平衡。
在实际应用中,AI服务器广泛服务于多种前沿场景。例如,它是训练深度学习模型(如GPT等大型语言模型)的关键基础设施,同时在计算机视觉、语音识别、自然语言处理等AI推理任务中也扮演着重要角色。许多行业正在借助AI服务器部署智能解决方案,包括智能制造、自动驾驶、金融风控以及生物医药等高技术领域。此外,AI服务器还被集成至边缘计算系统和云端AI平台,作为算力支撑单元,为分布式智能服务提供强大后端计算能力。
aspcms.cnAI服务器的产业链涵盖了从硬件生产到最终用户应用的多个环节。在上游,涉及的主要企业包括半导体公司和硬件制造商,如英伟达(NVIDIA)、英特尔(Intel)、AMD等,这些公司提供AI加速卡、处理器、内存等基础硬件。在这一层,技术创新的关键集中在提升计算能力和降低功耗,同时满足AI应用对处理器架构的特殊要求。此外,还有云服务供应商和硬件平台提供商,这些企业提供AI训练和推理的基础设施,帮助企业和研究机构降低进入门槛。
中游的公司主要集中在系统集成和硬件优化领域。它们负责将上游的硬件组件进行整合,提供定制化的AI服务器解决方案,确保硬件与软件的兼容性与优化,达到最佳的性能。在这一环节中,企业通常需要与AI框架、数据中心、以及硬件供应商紧密合作,保证产品的稳定性和高效性。
下游的应用则主要分布在不同的行业领域,包括自动驾驶、智能制造、医疗影像分析、语音识别等。这些行业企业利用AI服务器进行模型训练、推理部署、数据分析等工作,推动技术的实际应用。在这个层级,AI服务器的需求主要体现在如何加速计算、优化算法以及处理海量数据,同时保障系统的高可用性和低延迟。
睿兽分析整理AI服务器相关公司近年的融资情况,2025年至2024年期间,AI服务器赛道的事件数量经历了先上升、后波动的趋势变化,2025年事件数量大幅增长至40起,2022事件数有所回落而在2023年事件数量回升至30起,或说明在经历一轮冷静后,AI服务器赛道重新获得关注,尤其是在大模型应用兴起的背景下,算力基础设施的重要性被再次放大。
️Gooxi国鑫
深圳市国鑫数智科技股份有限公司于2014年12月创立,是一家是服务器解决方案供应商,具有全产业链的自主研发能力和生产能力,是目前中国屈指可数的集研发、生产、销售、服务于一体的服务器和存储软硬件厂商之一。
其产品涵盖通用计算服务器、智算服务器、超融合服务器、边缘计算服务器、存储服务器和服务器机箱、主板、配件等;同时可以面向不同行业的客户需求提供定制化的产品和整体解决方案。公司获得了“国家高新技术企业”、“国家专精特新小巨人企业”、“深圳市专精特新企业”、“深圳市骨干企业”等多项国家级高科技企业认证。
Gooxi国鑫具备从机箱、主板到整机系统的全栈自主研发能力,涵盖BIOS、BMC等多类软硬件技术,并拥有自主生产基地,年产能超过30万台服务器,能够为多家上市企业和大型客户提供定制化服务器解决方案。其产品已广泛部署于人工智能、云计算、云存储及数据中心等多个应用场景。
2024年12月,Gooxi国鑫完成数千万元A轮融资,本轮由同创伟业独家投资。
️天数智芯
上海天数智芯半导体股份有限公司成立于2015年12月,专注通用GPU架构下国产自主可控AI芯片的技术研发,是通用GPU 高端芯片及超级算力系统提供商。致力于开发自主可控、高性能通用GPU产品,探索通用GPU赶超发展道路,加快建设自主产业生态,为全产业提供高端算力解决方案。
天数智芯的核心产品包括采用7纳米工艺的Big Island GPU系列,该系列因其高性能与低功耗而具备显著优势,在同类产品中实现了接近两倍的性能表现。与此同时,公司还推出了通用GPU推理产品“智铠100”,进一步拓展了产品线,满足多样化的市场需求。
在商业模式方面,天数智芯主要依托其高性能通用GPU的销售和定制化算力解决方案服务获取收益。公司通过为不同行业提供个性化的算力支持,满足人工智能、金融、医疗等高算力需求领域客户的技术诉求,实现了价值变现。其价值网络也逐步建立,通过运营如DeepSpark开源社区等平台,聚集了大量开发者与合作伙伴,共同推动算力技术的研发与落地。这一融合技术、产品与社区的模式,使天数智芯在竞争激烈的市场中具备持续增长的动能。
在整个半导体产业链中,天数智芯通过推出自主可控的通用GPU,补齐了国内高端算力领域的短板。其产品不仅兼容国内外主流AI生态和深度学习框架,还带动了上下游企业的协同创新,加快了人工智能、金融、医疗、教育、零售等行业算力方案的实际应用。借助DeepSpark社区的持续赋能,天数智芯不断推进算法与模型的更新迭代。
️长江计算
武汉长江计算科技有限公司成立于2025年5月,是一家集服务器、计算机、存储产品、云计算等相关软硬件产品的研发、生产、销售和售后于一体,独立运营多样性计算产业的企业。
长江计算已形成通用服务器、人工智能服务器(含训练/推理型)、全液冷整机柜服务器(如AccelerPoD 5000系列)、存储产品及终端五大类算力产品线。其技术核心在于硬件自主可控与绿色节能创新:硬件层面采用国产鲲鹏920 CPU及自研主板,实现核心部件自主设计;全液冷整机柜单柜可提供64颗CPU+128颗GPU算力,应用于武汉超算中心等国家级项目,显著降低数据中心能耗(PUE值优化)。自主研发的AI质检系统在3C制造业实现单工位检测准确率100%,缺陷识别效率提升3倍,为年产线创造超500万元经济增益;系统支持多行业SDK推广,已拓展至集成电路、光伏、半导体等领域。自建自动化测试平台实现服务器100%全检,并通过24小时极限压力测试保障稳定性;与华为联合构建智能质检方案,质检准确率超99%,入选工信部“智能制造试点示范工厂”。
长江计算已逐步“解锁”从通用算力、智能算力到高性能算力所有算力服务器,形成了提供定制化服务的专业解决方案能力。在位于光谷的制造基地,已构建日均生产600台服务器的产能。
2024年1月,长江计算完成5亿元天使轮融资,投资方包括国开科创、光谷烽火创投、光大金控、越秀产业基金、东湖创投、武汉科投及国开金融。
️2025年5月,微软Azure与印度Yotta合作,投资5亿美元建设亚洲最大AI数据中心
5月28日,微软宣布与印度Yotta Data Services合作,在孟买投资5亿美元建设亚洲最大AI数据中心,部署20,000颗NVIDIA B200 GPU,总算力达800 ExaFLOPS。该数据中心将采用微软Azure AI架构,重点支持印度本土语言大模型开发,并整合Yotta的Shardeum区块链技术确保数据安全。印度电子和信息技术部部长表示,该项目将加速印度“AI for All”国家战略,预计2026年Q1投入运营。
️2025年5月,戴尔发布NVIDIA芯片驱动AI服务器,加速企业应用
5月19日,戴尔推出新一代AI服务器PowerEdge XE9640,搭载英伟达H200 Tensor Core GPU和BlueField-3 DPU,专为企业级AI训练与推理优化。该服务器支持单节点8 GPU配置,可处理万亿参数模型,并集成戴尔智能冷却技术,能耗降低20%。戴尔称已获摩根大通、西门子等客户预订。
️2025年4月,英伟达宣布组建美国本土AI服务器产业链,目标4年产值5000亿美元
4月14日,美国AI芯片巨头英伟达发布公告称,正在联合一众供应商制造工厂,将在未来几年里实现AI超级计算机的美国本土化制造。英伟达披露,已经在亚利桑那州启用“超过百万平方英尺”的生产空间用于Blackwell芯片制造测试,并正在得克萨斯州,与合作伙伴共同建立人工智能超级计算机的生产线。
️2025年4月,车卫士集团携手华为云构建AI智能服务 开启汽车后市场新生态
2025年4月,车卫士集团正式启动与华为云的深度合作,基于DeepSeek-R1、Flux等大模型及华为云AI服务,共同打造多模态AIGC综合服务智能体。此次合作融入鸿蒙生态体系,通过分布式技术架构与原子化服务设计,构建 “人-车-生活” 一体化服务闭环,标志着汽车后市场服务向智能化、场景化转型的里程碑式突破。
️2025年3月,NVIDIA GTC大会发布新一代超算系统,AI数据中心效率革命性突破
3月18日,NVIDIA在年度GTC技术大会上正式推出三款划时代产品:DGX H2000超算系统、Quantum-X800光网络交换机和Earth-2气候建模超算平台。其中DGX H2000采用新一代HBM4内存技术,单机柜算力高达40 PetaFLOPS,较上一代提升8倍;Quantum-X800实现8Tb/s超高速光互连,延迟仅5纳秒;Earth-2平台整合1000颗最新B200芯片,可完成1公里精度的全球气候实时模拟。