分类
LLM大语言模型综述论文
自 2022 年 11 月 ChatGPT 发布以来,大型语言模型 (LLM) 因其在广泛自然语言任务上表现出的强大性能而受到广泛关注。正如缩放定律 [1, 2] 所预测的那样
学习导师大比拼:Deepseek、豆包和通义千问谁更牛?
在 AI 的奇妙世界里,有三位 “大神” 级别的学习导师 ——Deepseek、豆包和通义千问,它们就像学习江湖中的各路大侠,各怀绝技。今天,咱们就来扒一扒这三位 “大侠”
通义千问爆甩开源全家桶!最强720亿参数超车Llama 2,新上视觉模型看图直出代码
刚刚,AI社区被这张图刷屏了。阿里云竟然开源了720亿参数通义千问大模型Qwen-72B,而且10个测评中,性能直接超越开源标杆Llama 2-70B。国产开源模型中
活动预告 | ChatGPT读书会第三期:基于微调机制(Finetuning)的细分领域大语言模型训练(下)
ChatGPT读书会第三期:基于微调机制(Finetuning)的细分领域大语言模型训练(下)
阿里云发布通义千问2.5,中文性能全面赶超GPT-4-Turbo
通义千问2.5在中文语境下模型性能全面赶超GPT-4-Turbo,同时,最新开源的Qwen1.5-110B也击败 Llama-3-70B









