02.06 | 通义千问Qwen2.5-Max登顶最新 AI 大模型榜单，ChatGPT搜索功能无需注册人人可用-JieYingAI捷鹰AI

AGI 掘金日报 - 2025 年 02 月 06 日

⭐ 今日热点全球第一：阿里云宣布通义千问 Qwen2.5-Max 数学及编程能力登顶最新 AI 大模型榜单

1 月 29 日新年之际，阿里云公布全新通义千问 Qwen 2.5-Max 超大规模 MoE 模型。在 Chatbot Arena 大模型盲测中，它超越多个模型，以 1332 分位列全球第七、非推理类中国大模型冠军。在数学和编程等单项能力上排第一，硬提示方面排第二。在多个主流基准测试中，比肩 Claude-3.5-Sonnet 并超越 GPT-4o 等模型。Chatbot Arena 是权威测试平台。

技术突破英国启动 70 万人全球最大规模乳腺癌 AI 诊断实验，有望解放数百名医生

2月4日，英国政府官网发布新闻稿，英国启动全球最大规模乳腺癌AI诊断试验，近70万妇女将参与。全国30个测试站点将用最新数字AI技术，辅助医生筛查乳腺癌迹象。目前每次乳腺X光检查需2名专家，新技术若成功，一人就能完成，有望解放数百名医生，降低癌症发病率。英国每年约55000人被诊断患乳腺癌。

DeepSeek 进入“国家队”，超算互联网上线 R1 / V3 / Coder 等系列模型

2月5日消息，DeepSeek-R1、V3、Coder等系列模型陆续上线国家超算互联网平台，R1小版本模型提供一键推理服务，还能定制化开发。国家超算互联网平台去年4月上线，有超3200款商品。超算互联网以互联网思维运营超算中心，构建一体化平台。其重要目标是连接供需双方，统筹算力资源，降低应用门槛，带动技术发展和产业生态成熟。

AI编程L1-L5超全分级来了！GitHub Copilot仅L1，Devin是L4

文章借鉴自动驾驶术语，将AI编程工具分为L1 - L5五个等级。L1为代码补全，如GitHub Copilot；L2实现任务自动化，像ChatGPT ，有工具辅助解决提示问题；L3处于项目自动化早期，能分析需求生成拉取请求；L4可实现从需求到部署全自动化，降低开发门槛；L5涉及多AI协作，微软论文及MGX有相关探索。开发者可依需求和项目复杂度选工具，未来AI将重塑编程领域。

超越DeepSeek V3！Ai2再祭开源杀器Tülu 3，强化学习打破性能瓶颈

美国艾伦人工智能研究所（Ai2）推出开源模型Tülu 3。2024年11月先推8B和70B版本，今年1月30日又推出405B版本，在多项基准测试中性能媲美甚至超越DeepSeek v3、GPT-4o等。Tülu 3采用全新后训练框架，包括开源数据、评估、代码等，用四阶段后训练配方及可验证奖励强化学习方法。训练用32个节点并行运行。它标志开放后训练研究新里程碑，方法值得开发者借鉴。

Anthropic 推“宪法分类器”，可大幅降低 Claude 越狱率

2月5日消息，Anthropic为解决AI工具滥用提示问题，推出“宪法分类器”，将人类价值观植入大模型。这一措施能大幅降低Claude 3.5 Sonnet越狱率，成功越狱情况减少81.6%，对性能影响小。Anthropic发布演示项目挑战用户突破CBRN相关关卡，却遭批评。其指出成功越狱是绕过而非规避分类器，并列举越狱方法。同时也承认测试时提示拒绝率高，测试系统有误报漏报可能。

企业动态 OpenAI 放大招：ChatGPT 搜索功能无需注册人人可用，分钟级别解析全网信息

2月6日凌晨 OpenAI 宣布，ChatGPT 搜索引擎无需登录账户即可使用。该功能最初去年 10 月向付费用户提供，12 月向所有用户开放。现在无需账户使用，将直接与谷歌等传统搜索引擎竞争。与传统收录模式搜索引擎相比，它能更快抓取解析网络信息，外观也更像传统搜索引擎，可查看地图、图片及结果简短描述。

谷歌 Gemini 2.0 Flash 系列 AI 模型登场，编程和推理性能迈上新台阶

2 月 5 日谷歌发布博文，邀请用户访问 Gemini 2.0 Flash 应用模型，放开 2.0 Flash Thinking 推理实验模型。2.0 Flash 适用于大规模任务，有强大多模态推理能力。2.0 Flash Thinking 能展示思考过程。谷歌还推出擅长编程的 2.0 Pro 实验版，及成本效益高的 2.0 Flash-Lite 模型。这些模型在不同应用场景有不同优势，开发者等可在相应平台体验。

亚马逊 2 月 26 日发布新一代 Alexa 生成式 AI 服务，使用 Claude 模型

亚马逊发出 2 月 26 日人工智能主题活动邀请，将推出新一代 Alexa 生成式 AI 服务。自 2014 年推出的 Alexa 语音助手现逐渐落后，此次升级是最大变革，能进行复杂对话、处理多请求。亚马逊采用 Anthropic 公司的 Claude 模型，因早期版本响应有问题，去年计划推迟。目前超 1 亿 Alexa 活跃用户，超 5 亿台支持设备，目标是转化部分用户为付费用户，初期先小范围免费测试。

三六零：公司暂未向 DeepSeek 提供任何服务

2月5日，三六零发布股票交易异常波动公告，其股票在1月24日、27日及2月5日连续三个交易日收盘价格涨幅偏离值累计超20% 。相关平台将其纳入DeepSeek概念股，三六零澄清在DeepSeek开源生态下部分产品有接入与本地化部署，但暂未向DeepSeek提供任何服务。此外，公司称目前经营正常，不存在重大事项筹划等可能影响股价的情况。

联想 AIPC 个人智能体“小天”接入 DeepSeek

2月5日，联想集团中国区市场部宣布，联想AIPC个人智能体“小天”接入DeepSeek，提升了在专业领域语言处理等多方面AI能力。目前“小天”已接入超1600款AI应用。“联想小天”由联想研发，采用本地大模型，结合用户个人知识库等提供AI功能，核心AI助手有工作、设备、会议助手。

中文在线：已在部分内部 AI 网文创作流程中部署 DeepSeek-R1

2月5日中文在线宣布，已在部分内部AI网文创作流程中部署DeepSeek-R1以增强创作效率。DeepSeek-V3采用MoE架构实现高效文本生成，DeepSeek-R1在推理等方面有优势。基于相关技术路线，中文在线正研发升级版“中文逍遥”。中文逍遥此前已推出1.0和2.0版本。2024年基于AI技术推出近百部漫画等作品，总观看量超30亿次。中文在线还表示将持续探索AIGC与大模型领域，强调AI为创作者赋能非取代。

DeepSeek 在网文领域首次应用，阅文“作家助手”升级三大辅助创作功能

2月5日，阅文集团宣布旗下“作家助手”集成独立部署的DeepSeek-R1大模型，这是DeepSeek首次在网文领域应用。集成后，“作家助手”在智能问答、获取灵感和描写润色三方面升级。“作家助手”覆盖多平台，功能丰富。1月20日，深度求索发布DeepSeek-R1模型并开源权重，第三方测试显示该模型超越OpenAI等美国公司。

盛天网络：正进行对接使用 Deepseek 模型，目前已部署完成进入测试阶段

1月26日投资者询问盛天网络AI产品与DeepSeek模型合作情况，2月5日公司回复已有合作，通过在线API接口及私有化部署方式开展工作，目前已部署完成进入测试阶段。该模型后续拟用于社交产品，一款对接的社交小游戏已完成一轮内测。盛天网络成立于2006年，是场景化泛娱乐平台。不过新技术应用或面临风险。

AMD 苏姿丰：DeepSeek 的出现是好事，模型和算法创新有利于 AI 应用

2 月 5 日 AMD 公布 2024 财年财报，第四季度营收 76.58 亿美元，同比增长 24%，全年营收 257.85 亿美元，同比增长 14%。董事长兼 CEO 苏姿丰称，AI 新突破如 DeepSeek-R1、“星际之门”项目为 AMD 带来增长机会。他对 DeepSeek 低成本高性能模型持乐观态度，认为创新利于 AI 应用。此外，AMD 去年 12 月公布支持 DeepSeek-V3 模型的 SGLang v0.4.1，今年 1 月将该模型集成到 Instinct MI300X GPU 上并针对 AI 推理优化。

英伟达憾失DeepSeek关键人才？美国放走AI「钱学森」，哈佛教授痛心疾首

哈佛教授称美国错失DeepSeek关键人才潘梓正，其放弃英伟达全职邀约回国，动摇美国AI主导地位。目前DeepSeek日活达ChatGPT的23%，下载量近500万。大佬讨论其未用OpenAI数据，因技术创新训练成本低，如采用MoE、MLA架构等。还提及中美在人才、计算能力等方面的竞争，以及对明星推理模型实测和AGI竞赛赢家的预测。

DeepSeek 系列新模型上线华为昇腾社区：一键获取，开箱即用

2月4日，DeepSeek-R1、DeepSeek-V3等模型正式上线华为昇腾社区，支持一键获取，在昇腾硬件平台可开箱即用、快速部署推理。IT之家还附上模型在GPU和NPU的权重转换、加载镜像、容器启动、服务化测试及修改服务化参数等调用方式，出现“Daemon start success!” 则服务成功启动。

OpenAI 视频生成工具 Sora 在好莱坞遇阻，仍未与电影公司达成任何合作

2月5日彭博社报道，传统媒体试水“AI变现”时，好莱坞很谨慎。OpenAI近半年与迪士尼等顶级制片厂接洽推广视频生成工具Sora，未达成实质性协议。好莱坞顾虑核心数据及编剧演员工会。2023年罢工余波尚在，阿尔特曼路演也未改变行业谨慎态度。狮门影业与AI企业合作，部分头部片商定制模型仅供内部用。授权老片库有收益但收益分配待解，科技与娱乐联姻尚需漫长博弈。

联通云上架 DeepSeek-R1 系列模型

2月5日，中国联通宣布联通云基于星罗平台实现国产及主流算力适配多规格DeepSeek-R1模型。基于多款主流算力卡预置多尺寸模型，用户可灵活选择、快速扩展。联通云骨干云池在全国270 +城市部署，7.5版本已上架镜像。联通云编程助手深度集成该模型，适配多端插件、支持多种编程语言，联通云电脑也支持其接入实现智能化升级。

华为小艺助手接入 DeepSeek，升级纯血鸿蒙 HarmonyOS NEXT 即可体验

2月5日消息，多位网友反馈，华为纯血鸿蒙HarmonyOS NEXT的小艺助手App接入DeepSeek，智能体广场上线DeepSeek-R1的Beta版。用户将小艺助手升级到11.2.10.310版本及以上，可在“发现”栏找到智能体广场，通过小艺助手与DeepSeek对话，实现更无缝AI体验。

韩国政府称 DeepSeek 带来冲击：将成立“国家 AI 委员会”，目标成为世界三大 AI 领先国家之一

2月5日彭博社报道，韩国计划投资至少34万亿韩元（约1699.66亿元人民币）助企业开发电池和生物技术尖端技术。还将尽快成立“国家AI委员会”，目标成为世界三大AI领先国之一，称DeepSeek技术带来“新冲击”。韩财政部将在韩国开发银行设新基金支持高科技产业。前一天OpenAI首席执行官访韩。韩财政部3月将在议会讨论相关法律修订。

✨ 行业观点 TrendForce：DeepSeek 的低成本 AI 模型将催生光通信需求

TrendForce集邦咨询研报称，DeepSeek模型降低AI训练成本，有望扩大应用场景、增加数据中心建置量。光收发模块作为数据中心互连关键组件，因光纤通信优势，能满足AI服务器数据传输要求，将受惠。该机构统计，2023年400Gbps以上光收发模块全球出货量640万个，2024年约2040万个，预计2025年超3190万个，年增长率达56.5% 。

谷歌 CEO 皮查伊盛赞 DeepSeek：非常出色，AI 成本下降有利于整个行业发展

2月5日，据《商业内幕》报道，谷歌CEO皮查伊在财报电话会议上盛赞中国AI开发商DeepSeek团队实力非凡、工作出色。随着AI推理成本降低，应用场景将拓展，为谷歌等带来新机会。谷歌的Gemini 2.0 Flash等模型效率可与DeepSeek R1抗衡。DeepSeek上月底发布的DeepSeek-R1性能媲美OpenAI的o1 ，但成本大幅降低。皮查伊还称降低AI成本能推动更多应用场景。在本财季财报会议上，DeepSeek成热门话题。

----------------------

AI资讯（所有发布文章都收录到合集中，方便查看）

AI应用（所有发布文章都收录到合集中，方便查看）

Cursor产品

图片[1]-02.06 | 通义千问Qwen2.5-Max登顶最新 AI 大模型榜单，ChatGPT搜索功能无需注册人人可用-JieYingAI捷鹰AI

版权声明 1 本网站名称：捷鹰AI导航
2 本站永久网址：www.jieyingai.com
3 本站原创内容转载请注明出处，付费内容未经本站授权禁止转载二次发布
4 本站所有内容禁止用于任何非法用途！部分文章、素材、资源软件来自网络，仅供大家学习与参考。如有侵权，请联系站长QQ:1392478547进行删除处理
5 本站投稿禁止发布任何违法内容，如发现将立即封号处理，欢迎举报监督
6 本站附件资源、教程等内容如因时效原因失效或不可用，请联系留言或联系站长及时更新

THE END