首页
热点
百科
娱乐
科技
资讯
药品
美容
时尚
登录
标签
Llama
英伟达发布 Llama Nemotron Nano VL
Llama Nemotron Nano VL 基于 Llama 3.1 架构,融合了 CRadioV2-H 视觉编码器和 Llama 3.18B 指令微调语言模型,能同时处理多页文档中的视觉和文本元素,支…
Nano
推理
数据
视觉
Llama
fjmyhfvclm
9天前
20
0
Research Triangle AI:2025年大语言模型入门报告
本报告围绕大语言模型(LLM)的基础概念、技术演进、实际应用及未来发展展开系统介绍,结合技术原理与实操演示,为入门者提供全面的知识框架。 报告总结了LLM的核心知识、部署流程及伦理思考,并推荐学习资源,如H…
能力
数据
语言
技术
Llama
fjmyhfvclm
20天前
53
0
Meta推出“Llama for Startups”计划,带动初创企业开发生成式AI应用
据《华尔街日报》报道,Meta推迟了旗舰AI模型Llama 4 Behemoth的发布,原因是担心该模型在关键基准测试中表现不佳。为推动相关产品的发展,Meta与一些托管其Llama模型的公司签订了收益分成…
企业
计划
Meta
产品
Llama
fjmyhfvclm
22天前
27
0
Mistral 发布 Medium 3:前沿性能与低成本兼具,含多种企业功能
IT之家 5 月 8 日消息,Mistral 当地时间 7 日推出了 Mistral 3 系列模型的中等量级版本 Medium3,宣传其同时具有前沿级别的性能和明显更低的成本,并具备多种企业功能。 Mist…
企业
Llama
功能
Medium
Mistral
fjmyhfvclm
1月前
43
0
“老当益壮”:AI 模型成功在 43 年前的 Commodore 64 电脑上运行
开发者Maciej Witkowiak成功将Llama2模型移植到1982年发布的Commodore 64电脑上运行,虽然生成的故事像3岁孩子的胡言乱语,但在如此古老的硬件上实现AI运行已是惊人突破。#AI黑…
科技
电脑
成功
Llama
硬件
fjmyhfvclm
1月前
37
0
PT通信早报 2025年4月27日 星期日
1.4月25日上午,国家数据局首个正局级事业单位——国家数据发展研究院正式揭牌,标志着我国在数据要素市场化配置、数据治理和国际合作方面迈出重要一步。6. 据界面新闻,当地时间4月25日,Meta和博思艾…
早报
Meta
数据
续航
Llama
fjmyhfvclm
1月前
52
0
Meta回应大模型Llama 4训练作弊争议
Meta公司刚刚发布Llama 4 Scout与Llama 4 Maverick,但随后就被曝出模型训练测试集作弊。在海外留学求职交流论坛“一亩三分地”上,发帖人自称是参与Llama 4训练的内部员工,他表…
的内部
Meta
数据
Llama
公司
fjmyhfvclm
2月前
53
0
美国能源部宣布在16个站点建设数据中心和人工智能基础设施
据欧盟委员会4月4日消息,欧盟与中亚国家领导人于当日在乌兹别克斯坦举行首次欧盟-中亚峰会,欧盟将启动总额为120亿欧元的“全球门户投资计划”,支持欧盟和中亚国家在交通基础设施、关键原材料、清洁能源和数字互联…
美国能源部
Llama
模型
人工智能
建设
fjmyhfvclm
2月前
54
0
2025年Q1漏洞态势分析报告-安恒信息
报告对2025年第一季度的漏洞数据进行多维度梳理,涵盖漏洞分布概况、重点漏洞回顾以及AI领域的安全资讯,旨在帮助用户识别风险、保护资产。微软在野漏洞:微软披露了多个在野利用漏洞,涉及Windows Hype…
Llama
安恒
数据
漏洞
代码
fjmyhfvclm
2月前
61
0
Meta,最新发布!“多模态性最强模型”
虽然Meta是开源模型的重要奠基者,但是开源领域的竞争正变得日益激烈和焦灼,尤其是DeepSeek的崛起,对Meta在开源模型社区的领先地位构成了巨大的冲击。4月4日,DeepSeek与清华大学研究团队联合…
Meta
推理
社区
DeepSeek
Llama
fjmyhfvclm
2月前
71
0
Meta 突袭开源 Llama 4 超 DeepSeek V3!千万上下文刷新纪录,2 万亿性能巨兽在路上
在 DeepSeek 掀起的这轮开源模型浪潮中,有一个开源王者似乎被遗忘了——Meta AI。 ???? 2880 亿激活参数量,总参数 2万亿(消费级根本跑不动) ???? 目标:在多模态处理与推理能力上实现突…
Meta
推理
数量
DeepSeek
Llama
fjmyhfvclm
2月前
58
0
Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?
【新智元导读】本文介绍了当前最受科研人员青睐的AI模型,推理出色的o3-mini、全能型DeepSeek-R1、科研常用的Llama、编程利器Claude3.5 Sonnet和开源明星Olmo 2,它们各…
Nature
推理
Llama
模型
Mini
fjmyhfvclm
2月前
64
0
DeepSeek-V3 模型完成小版本升级,已可试用体验
IT之家 3 月 24 日消息,DeepSeek 在其官方交流群宣布称,DeepSeek-V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API 接口和使用方式保持不变。…
成本
Sonnet
Claude
Llama
模型
fjmyhfvclm
2月前
59
0
AMD 推出 AI 开源项目“GAIA”:目前仅适用于 Windows
月 22 日消息,当地时间周四,AMD 宣布推出专为本地运行大语言模型(LLM)设计的应用 GAIA(发音为ˈɡaɪ.ə)并在 Github开源,目前仅限于 Windows 平台。AMD 表示,Ryze…
Llama
GitHub
模型
项目
处理器
fjmyhfvclm
2月前
46
0
Meta计划在其开源大型语言模型Llama 4中引入改进的语音功能
3月7日, 据英国金融时报,知情人士表示,Meta计划在其最新的开源大型语言模型Llama 4中引入改进的语音功能,预计将在未来几周内推出。该公司押注未来所谓的人工智能代理将是对话式的,而不是以文本为主导的。…
计划
Meta
英国金融时报
语言
Llama
fjmyhfvclm
3月前
46
0
Meta首席产品官预告Llama 4将具有推理能力
Meta首席产品官Chris Cox周三表示,即将推出的Llama 4AI软件将有助于增强AI代理的能力,是生成式AI领域的最新趋势。Cox表示,Llama 4将具有推理能力,并创建能够使用网页浏览器和其他…
Meta
能力
推理
产品
Llama
fjmyhfvclm
3月前
51
0
大模型本地部署训练和应用实践班
DeepSeek的MoE架构,在R1、V3两个不同模型上的对比技术亮点 量化加速FP8的特点对比Deepseek原论文中量化章节的解读REST API调用:深度学习系统部署的常用方式针对AI算法的部署框架第…
DeepSeek
Llama
Coze
模型
训练
fjmyhfvclm
3月前
54
0
第四范式推出大模型推理端侧解决方案ModelHub AIoT
记者从第四范式了解到,2月25日,,用户在端侧可轻松部署包括DeepSeek R1、Qwen 2.5、Llama 23系列等小尺寸蒸馏模型,并实现离线运行。成本优化方面,端侧部署可有效降低对云端资源的依赖,…
推理
解决方案
降低
DeepSeek
Llama
fjmyhfvclm
3月前
66
0
百度文心将开源,李彦宏“叛变”李彦宏
至于最终选择不开源的原因,李彦宏称,“当时的判断是,市场上一定会有开源的模型,而且是不止一家会开源。 而最后的结果也显而易见,在DeepSeek完全开源的攻势之下,别说百度,就连OpenAI也已经无力抵挡,表…
offer
文心
闭源
技术
Llama
fjmyhfvclm
4月前
84
0
手把手教学:40000 元在家跑顶级DeepSeek R1的完整方案!
Hugging Face工程师Matthew Carrigan公布了一套超详细的配置指南,让普通人也能用6000美元在家运行DeepSeekR1这样的超大模型,对应人民币则约4万元。 别担心,不需要买最贵…
因为
Llama
cpp
方案
DeepSeek
fjmyhfvclm
4月前
107
0
DeepSeek引发资本市场对算力增长展望的担忧 华泰证券分析
华泰证券研报称,DeepSeek发布R1模型及相关应用,以较低的训练成本达到与现有前沿模型相当的效果,引发市场对算力投资的担忧。华泰证券认为:1)DeepSeek主要创新是通过在预训练阶段加入强化学习,Dee…
成本
华泰证券
市场
DeepSeek
Llama
fjmyhfvclm
4月前
98
0
“DeepSeek 甚至绕过了英伟达 CUDA”,论文细节再引热议
首先要明确的是,PTX 仍然是英伟达 GPU 架构中的技术,它是 CUDA 编程模型中的中间表示,用于连接 CUDA 高级语言代码和 GPU底层硬件指令。 我们不知道 DeepSeek 内部是否使用 A…
cpp
DeepSeek
Llama
代码
硬件
fjmyhfvclm
4月前
95
0
Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释
最近,有 Meta 员工在美国匿名职场社区 teamblind 上面发布了一个帖子。帖子提到,国内 AI 创业公司 DeepSeek最近的一系列动作让 Meta 的生成式 AI 团队陷入了恐慌,因为在前者…
分析
Meta
DeepSeek
Llama
hours
fjmyhfvclm
4月前
108
0