Llama

英伟达发布 Llama Nemotron Nano VL
Llama Nemotron Nano VL 基于 Llama 3.1 架构，融合了 CRadioV2-H 视觉编码器和 Llama 3.18B 指令微调语言模型，能同时处理多页文档中的视觉和文本元素，支…
Nano推理数据视觉Llama
fjmyhfvclm9天前
200
Research Triangle AI：2025年大语言模型入门报告
本报告围绕大语言模型（LLM）的基础概念、技术演进、实际应用及未来发展展开系统介绍，结合技术原理与实操演示，为入门者提供全面的知识框架。报告总结了LLM的核心知识、部署流程及伦理思考，并推荐学习资源，如H…
能力数据语言技术Llama
fjmyhfvclm20天前
530
Meta推出“Llama for Startups”计划，带动初创企业开发生成式AI应用
据《华尔街日报》报道，Meta推迟了旗舰AI模型Llama 4 Behemoth的发布，原因是担心该模型在关键基准测试中表现不佳。为推动相关产品的发展，Meta与一些托管其Llama模型的公司签订了收益分成…
企业计划Meta产品Llama
fjmyhfvclm22天前
270
Mistral 发布 Medium 3：前沿性能与低成本兼具，含多种企业功能
IT之家 5 月 8 日消息，Mistral 当地时间 7 日推出了 Mistral 3 系列模型的中等量级版本 Medium3，宣传其同时具有前沿级别的性能和明显更低的成本，并具备多种企业功能。 Mist…
企业Llama功能MediumMistral
fjmyhfvclm1月前
430
“老当益壮”：AI 模型成功在 43 年前的 Commodore 64 电脑上运行
开发者Maciej Witkowiak成功将Llama2模型移植到1982年发布的Commodore 64电脑上运行，虽然生成的故事像3岁孩子的胡言乱语，但在如此古老的硬件上实现AI运行已是惊人突破。#AI黑…
科技电脑成功Llama硬件
fjmyhfvclm1月前
370
PT通信早报 2025年4月27日星期日
1.4月25日上午，国家数据局首个正局级事业单位——国家数据发展研究院正式揭牌，标志着我国在数据要素市场化配置、数据治理和国际合作方面迈出重要一步。6. 据界面新闻，当地时间4月25日，Meta和博思艾…
早报Meta数据续航Llama
fjmyhfvclm1月前
520
Meta回应大模型Llama 4训练作弊争议
Meta公司刚刚发布Llama 4 Scout与Llama 4 Maverick，但随后就被曝出模型训练测试集作弊。在海外留学求职交流论坛“一亩三分地”上，发帖人自称是参与Llama 4训练的内部员工，他表…
的内部Meta数据Llama公司
fjmyhfvclm2月前
530
美国能源部宣布在16个站点建设数据中心和人工智能基础设施
据欧盟委员会4月4日消息，欧盟与中亚国家领导人于当日在乌兹别克斯坦举行首次欧盟-中亚峰会，欧盟将启动总额为120亿欧元的“全球门户投资计划”，支持欧盟和中亚国家在交通基础设施、关键原材料、清洁能源和数字互联…
美国能源部Llama模型人工智能建设
fjmyhfvclm2月前
540
2025年Q1漏洞态势分析报告-安恒信息
报告对2025年第一季度的漏洞数据进行多维度梳理，涵盖漏洞分布概况、重点漏洞回顾以及AI领域的安全资讯，旨在帮助用户识别风险、保护资产。微软在野漏洞：微软披露了多个在野利用漏洞，涉及Windows Hype…
Llama安恒数据漏洞代码
fjmyhfvclm2月前
610
Meta，最新发布！“多模态性最强模型”
虽然Meta是开源模型的重要奠基者，但是开源领域的竞争正变得日益激烈和焦灼，尤其是DeepSeek的崛起，对Meta在开源模型社区的领先地位构成了巨大的冲击。4月4日，DeepSeek与清华大学研究团队联合…
Meta推理社区DeepSeekLlama
fjmyhfvclm2月前
710
Meta 突袭开源 Llama 4 超 DeepSeek V3！千万上下文刷新纪录，2 万亿性能巨兽在路上
在 DeepSeek 掀起的这轮开源模型浪潮中，有一个开源王者似乎被遗忘了——Meta AI。 ???? 2880 亿激活参数量，总参数 2万亿（消费级根本跑不动） ???? 目标：在多模态处理与推理能力上实现突…
Meta推理数量DeepSeekLlama
fjmyhfvclm2月前
580
Nature：科研人员最爱AI工具大盘点！从推理到编程，哪款才是最佳助手？
【新智元导读】本文介绍了当前最受科研人员青睐的AI模型，推理出色的o3-mini、全能型DeepSeek-R1、科研常用的Llama、编程利器Claude3.5 Sonnet和开源明星Olmo 2，它们各…
Nature推理Llama模型Mini
fjmyhfvclm2月前
640
DeepSeek-V3 模型完成小版本升级，已可试用体验
IT之家 3 月 24 日消息，DeepSeek 在其官方交流群宣布称，DeepSeek-V3模型已完成小版本升级，欢迎前往官方网页、App、小程序试用体验（关闭深度思考），API 接口和使用方式保持不变。…
成本SonnetClaudeLlama模型
fjmyhfvclm2月前
590
AMD 推出 AI 开源项目“GAIA”：目前仅适用于 Windows
月 22 日消息，当地时间周四，AMD 宣布推出专为本地运行大语言模型（LLM）设计的应用 GAIA（发音为ˈɡaɪ.ə）并在 Github开源，目前仅限于 Windows 平台。AMD 表示，Ryze…
LlamaGitHub模型项目处理器
fjmyhfvclm2月前
460
Meta计划在其开源大型语言模型Llama 4中引入改进的语音功能
3月7日，据英国金融时报，知情人士表示，Meta计划在其最新的开源大型语言模型Llama 4中引入改进的语音功能，预计将在未来几周内推出。该公司押注未来所谓的人工智能代理将是对话式的，而不是以文本为主导的。…
计划Meta英国金融时报语言Llama
fjmyhfvclm3月前
460
Meta首席产品官预告Llama 4将具有推理能力
Meta首席产品官Chris Cox周三表示，即将推出的Llama 4AI软件将有助于增强AI代理的能力，是生成式AI领域的最新趋势。Cox表示，Llama 4将具有推理能力，并创建能够使用网页浏览器和其他…
Meta能力推理产品Llama
fjmyhfvclm3月前
510
大模型本地部署训练和应用实践班
DeepSeek的MoE架构，在R1、V3两个不同模型上的对比技术亮点量化加速FP8的特点对比Deepseek原论文中量化章节的解读REST API调用：深度学习系统部署的常用方式针对AI算法的部署框架第…
DeepSeekLlamaCoze模型训练
fjmyhfvclm3月前
540
第四范式推出大模型推理端侧解决方案ModelHub AIoT
记者从第四范式了解到，2月25日，，用户在端侧可轻松部署包括DeepSeek R1、Qwen 2.5、Llama 23系列等小尺寸蒸馏模型，并实现离线运行。成本优化方面，端侧部署可有效降低对云端资源的依赖，…
推理解决方案降低DeepSeekLlama
fjmyhfvclm3月前
660
百度文心将开源，李彦宏“叛变”李彦宏
至于最终选择不开源的原因，李彦宏称，“当时的判断是，市场上一定会有开源的模型，而且是不止一家会开源。而最后的结果也显而易见，在DeepSeek完全开源的攻势之下，别说百度，就连OpenAI也已经无力抵挡，表…
offer文心闭源技术Llama
fjmyhfvclm4月前
840
手把手教学：40000 元在家跑顶级DeepSeek R1的完整方案！
Hugging Face工程师Matthew Carrigan公布了一套超详细的配置指南，让普通人也能用6000美元在家运行DeepSeekR1这样的超大模型，对应人民币则约4万元。别担心，不需要买最贵…
因为Llamacpp方案DeepSeek
fjmyhfvclm4月前
1070
DeepSeek引发资本市场对算力增长展望的担忧华泰证券分析
华泰证券研报称，DeepSeek发布R1模型及相关应用，以较低的训练成本达到与现有前沿模型相当的效果，引发市场对算力投资的担忧。华泰证券认为：1）DeepSeek主要创新是通过在预训练阶段加入强化学习，Dee…
成本华泰证券市场DeepSeekLlama
fjmyhfvclm4月前
980
“DeepSeek 甚至绕过了英伟达 CUDA”，论文细节再引热议
首先要明确的是，PTX 仍然是英伟达 GPU 架构中的技术，它是 CUDA 编程模型中的中间表示，用于连接 CUDA 高级语言代码和 GPU底层硬件指令。我们不知道 DeepSeek 内部是否使用 A…
cppDeepSeekLlama代码硬件
fjmyhfvclm4月前
950
Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释
最近，有 Meta 员工在美国匿名职场社区 teamblind 上面发布了一个帖子。帖子提到，国内 AI 创业公司 DeepSeek最近的一系列动作让 Meta 的生成式 AI 团队陷入了恐慌，因为在前者…
分析MetaDeepSeekLlamahours
fjmyhfvclm4月前
1080