02.06 | 通义千问Qwen2.5-Max登顶最新 AI 大模型榜单,ChatGPT搜索功能无需注册人人可用

AGI 掘金日报 - 2025 年 02 月 06 日

⭐ 今日热点 全球第一:阿里云宣布通义千问 Qwen2.5-Max 数学及编程能力登顶最新 AI 大模型榜单

1 月 29 日新年之际,阿里云公布全新通义千问 Qwen 2.5-Max 超大规模 MoE 模型。在 Chatbot Arena 大模型盲测中,它超越多个模型,以 1332 分位列全球第七、非推理类中国大模型冠军。在数学和编程等单项能力上排第一,硬提示方面排第二。在多个主流基准测试中,比肩 Claude-3.5-Sonnet 并超越 GPT-4o 等模型。Chatbot Arena 是权威测试平台 。

技术突破 英国启动 70 万人全球最大规模乳腺癌 AI 诊断实验,有望解放数百名医生

2月4日,英国政府官网发布新闻稿,英国启动全球最大规模乳腺癌AI诊断试验,近70万妇女将参与。全国30个测试站点将用最新数字AI技术,辅助医生筛查乳腺癌迹象。目前每次乳腺X光检查需2名专家,新技术若成功,一人就能完成,有望解放数百名医生,降低癌症发病率。英国每年约55000人被诊断患乳腺癌 。

DeepSeek 进入“国家队”,超算互联网上线 R1 / V3 / Coder 等系列模型

2月5日消息,DeepSeek-R1、V3、Coder等系列模型陆续上线国家超算互联网平台,R1小版本模型提供一键推理服务,还能定制化开发。国家超算互联网平台去年4月上线,有超3200款商品。超算互联网以互联网思维运营超算中心,构建一体化平台。其重要目标是连接供需双方,统筹算力资源,降低应用门槛,带动技术发展和产业生态成熟。

AI编程L1-L5超全分级来了!GitHub Copilot仅L1,Devin是L4

文章借鉴自动驾驶术语,将AI编程工具分为L1 - L5五个等级。L1为代码补全,如GitHub Copilot;L2实现任务自动化,像ChatGPT ,有工具辅助解决提示问题;L3处于项目自动化早期,能分析需求生成拉取请求;L4可实现从需求到部署全自动化,降低开发门槛;L5涉及多AI协作,微软论文及MGX有相关探索。开发者可依需求和项目复杂度选工具,未来AI将重塑编程领域。

超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈

美国艾伦人工智能研究所(Ai2)推出开源模型Tülu 3。2024年11月先推8B和70B版本,今年1月30日又推出405B版本,在多项基准测试中性能媲美甚至超越DeepSeek v3、GPT-4o等。Tülu 3采用全新后训练框架,包括开源数据、评估、代码等,用四阶段后训练配方及可验证奖励强化学习方法。训练用32个节点并行运行。它标志开放后训练研究新里程碑,方法值得开发者借鉴 。

Anthropic 推“宪法分类器”,可大幅降低 Claude 越狱率

2月5日消息,Anthropic为解决AI工具滥用提示问题,推出“宪法分类器”,将人类价值观植入大模型。这一措施能大幅降低Claude 3.5 Sonnet越狱率,成功越狱情况减少81.6%,对性能影响小。Anthropic发布演示项目挑战用户突破CBRN相关关卡,却遭批评。其指出成功越狱是绕过而非规避分类器,并列举越狱方法。同时也承认测试时提示拒绝率高,测试系统有误报漏报可能 。

企业动态 OpenAI 放大招:ChatGPT 搜索功能无需注册人人可用,分钟级别解析全网信息

2月6日凌晨 OpenAI 宣布,ChatGPT 搜索引擎无需登录账户即可使用。该功能最初去年 10 月向付费用户提供,12 月向所有用户开放。现在无需账户使用,将直接与谷歌等传统搜索引擎竞争。与传统收录模式搜索引擎相比,它能更快抓取解析网络信息,外观也更像传统搜索引擎,可查看地图、图片及结果简短描述。

谷歌 Gemini 2.0 Flash 系列 AI 模型登场,编程和推理性能迈上新台阶

2 月 5 日谷歌发布博文,邀请用户访问 Gemini 2.0 Flash 应用模型,放开 2.0 Flash Thinking 推理实验模型。2.0 Flash 适用于大规模任务,有强大多模态推理能力。2.0 Flash Thinking 能展示思考过程。谷歌还推出擅长编程的 2.0 Pro 实验版,及成本效益高的 2.0 Flash-Lite 模型。这些模型在不同应用场景有不同优势,开发者等可在相应平台体验 。

亚马逊 2 月 26 日发布新一代 Alexa 生成式 AI 服务,使用 Claude 模型

亚马逊发出 2 月 26 日人工智能主题活动邀请,将推出新一代 Alexa 生成式 AI 服务。自 2014 年推出的 Alexa 语音助手现逐渐落后,此次升级是最大变革,能进行复杂对话、处理多请求。亚马逊采用 Anthropic 公司的 Claude 模型,因早期版本响应有问题,去年计划推迟。目前超 1 亿 Alexa 活跃用户,超 5 亿台支持设备,目标是转化部分用户为付费用户,初期先小范围免费测试 。

三六零:公司暂未向 DeepSeek 提供任何服务

2月5日,三六零发布股票交易异常波动公告,其股票在1月24日、27日及2月5日连续三个交易日收盘价格涨幅偏离值累计超20% 。相关平台将其纳入DeepSeek概念股,三六零澄清在DeepSeek开源生态下部分产品有接入与本地化部署,但暂未向DeepSeek提供任何服务。此外,公司称目前经营正常,不存在重大事项筹划等可能影响股价的情况 。

联想 AIPC 个人智能体“小天”接入 DeepSeek

2月5日,联想集团中国区市场部宣布,联想AIPC个人智能体“小天”接入DeepSeek,提升了在专业领域语言处理等多方面AI能力。目前“小天”已接入超1600款AI应用。“联想小天”由联想研发,采用本地大模型,结合用户个人知识库等提供AI功能,核心AI助手有工作、设备、会议助手 。

中文在线:已在部分内部 AI 网文创作流程中部署 DeepSeek-R1

2月5日中文在线宣布,已在部分内部AI网文创作流程中部署DeepSeek-R1以增强创作效率。DeepSeek-V3采用MoE架构实现高效文本生成,DeepSeek-R1在推理等方面有优势。基于相关技术路线,中文在线正研发升级版“中文逍遥”。中文逍遥此前已推出1.0和2.0版本。2024年基于AI技术推出近百部漫画等作品,总观看量超30亿次。中文在线还表示将持续探索AIGC与大模型领域,强调AI为创作者赋能非取代。

DeepSeek 在网文领域首次应用,阅文“作家助手”升级三大辅助创作功能

2月5日,阅文集团宣布旗下“作家助手”集成独立部署的DeepSeek-R1大模型,这是DeepSeek首次在网文领域应用。集成后,“作家助手”在智能问答、获取灵感和描写润色三方面升级。“作家助手”覆盖多平台,功能丰富。1月20日,深度求索发布DeepSeek-R1模型并开源权重,第三方测试显示该模型超越OpenAI等美国公司 。

盛天网络:正进行对接使用 Deepseek 模型,目前已部署完成进入测试阶段

1月26日投资者询问盛天网络AI产品与DeepSeek模型合作情况,2月5日公司回复已有合作,通过在线API接口及私有化部署方式开展工作,目前已部署完成进入测试阶段。该模型后续拟用于社交产品,一款对接的社交小游戏已完成一轮内测。盛天网络成立于2006年,是场景化泛娱乐平台。不过新技术应用或面临风险 。

AMD 苏姿丰:DeepSeek 的出现是好事,模型和算法创新有利于 AI 应用

2 月 5 日 AMD 公布 2024 财年财报,第四季度营收 76.58 亿美元,同比增长 24%,全年营收 257.85 亿美元,同比增长 14%。董事长兼 CEO 苏姿丰称,AI 新突破如 DeepSeek-R1、“星际之门”项目为 AMD 带来增长机会。他对 DeepSeek 低成本高性能模型持乐观态度,认为创新利于 AI 应用。此外,AMD 去年 12 月公布支持 DeepSeek-V3 模型的 SGLang v0.4.1,今年 1 月将该模型集成到 Instinct MI300X GPU 上并针对 AI 推理优化。

英伟达憾失DeepSeek关键人才?美国放走AI「钱学森」,哈佛教授痛心疾首

哈佛教授称美国错失DeepSeek关键人才潘梓正,其放弃英伟达全职邀约回国,动摇美国AI主导地位。目前DeepSeek日活达ChatGPT的23%,下载量近500万。大佬讨论其未用OpenAI数据,因技术创新训练成本低,如采用MoE、MLA架构等。还提及中美在人才、计算能力等方面的竞争,以及对明星推理模型实测和AGI竞赛赢家的预测 。

DeepSeek 系列新模型上线华为昇腾社区:一键获取,开箱即用

2月4日,DeepSeek-R1、DeepSeek-V3等模型正式上线华为昇腾社区,支持一键获取,在昇腾硬件平台可开箱即用、快速部署推理。IT之家还附上模型在GPU和NPU的权重转换、加载镜像、容器启动、服务化测试及修改服务化参数等调用方式,出现“Daemon start success!” 则服务成功启动。

OpenAI 视频生成工具 Sora 在好莱坞遇阻,仍未与电影公司达成任何合作

2月5日彭博社报道,传统媒体试水“AI变现”时,好莱坞很谨慎。OpenAI近半年与迪士尼等顶级制片厂接洽推广视频生成工具Sora,未达成实质性协议。好莱坞顾虑核心数据及编剧演员工会。2023年罢工余波尚在,阿尔特曼路演也未改变行业谨慎态度。狮门影业与AI企业合作,部分头部片商定制模型仅供内部用。授权老片库有收益但收益分配待解,科技与娱乐联姻尚需漫长博弈 。

联通云上架 DeepSeek-R1 系列模型

2月5日,中国联通宣布联通云基于星罗平台实现国产及主流算力适配多规格DeepSeek-R1模型。基于多款主流算力卡预置多尺寸模型,用户可灵活选择、快速扩展。联通云骨干云池在全国270 +城市部署,7.5版本已上架镜像。联通云编程助手深度集成该模型,适配多端插件、支持多种编程语言,联通云电脑也支持其接入实现智能化升级 。

华为小艺助手接入 DeepSeek,升级纯血鸿蒙 HarmonyOS NEXT 即可体验

2月5日消息,多位网友反馈,华为纯血鸿蒙HarmonyOS NEXT的小艺助手App接入DeepSeek,智能体广场上线DeepSeek-R1的Beta版。用户将小艺助手升级到11.2.10.310版本及以上,可在“发现”栏找到智能体广场,通过小艺助手与DeepSeek对话,实现更无缝AI体验。

韩国政府称 DeepSeek 带来冲击:将成立“国家 AI 委员会”,目标成为世界三大 AI 领先国家之一

2月5日彭博社报道,韩国计划投资至少34万亿韩元(约1699.66亿元人民币)助企业开发电池和生物技术尖端技术。还将尽快成立“国家AI委员会”,目标成为世界三大AI领先国之一,称DeepSeek技术带来“新冲击”。韩财政部将在韩国开发银行设新基金支持高科技产业。前一天OpenAI首席执行官访韩。韩财政部3月将在议会讨论相关法律修订。

✨ 行业观点 TrendForce:DeepSeek 的低成本 AI 模型将催生光通信需求

TrendForce集邦咨询研报称,DeepSeek模型降低AI训练成本,有望扩大应用场景、增加数据中心建置量。光收发模块作为数据中心互连关键组件,因光纤通信优势,能满足AI服务器数据传输要求,将受惠。该机构统计,2023年400Gbps以上光收发模块全球出货量640万个,2024年约2040万个,预计2025年超3190万个,年增长率达56.5% 。

谷歌 CEO 皮查伊盛赞 DeepSeek:非常出色,AI 成本下降有利于整个行业发展

2月5日,据《商业内幕》报道,谷歌CEO皮查伊在财报电话会议上盛赞中国AI开发商DeepSeek团队实力非凡、工作出色。随着AI推理成本降低,应用场景将拓展,为谷歌等带来新机会。谷歌的Gemini 2.0 Flash等模型效率可与DeepSeek R1抗衡。DeepSeek上月底发布的DeepSeek-R1性能媲美OpenAI的o1 ,但成本大幅降低。皮查伊还称降低AI成本能推动更多应用场景。在本财季财报会议上,DeepSeek成热门话题。

----------------------

AI资讯(所有发布文章都收录到合集中,方便查看)

AI应用 (所有发布文章都收录到合集中,方便查看)

Cursor产品

图片[1]-02.06 | 通义千问Qwen2.5-Max登顶最新 AI 大模型榜单,ChatGPT搜索功能无需注册人人可用-JieYingAI捷鹰AI

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享