分类
CC-OCR | 通义千问团队提出一个全面且具有挑战性的多模态模型阅读能力评估基准
导读对大型多模态模型 (LMMs) 来说,阅读能力至关重要。阅读能力不仅包括阅读纯文本,还涉及位置定位、结构化布局以及格式化输入和输出。
Midjourney V6 发布:细节拉满,叫板DALLE3,重新定义提示词规则【附V6提示词指南】
V6是我们在AI超级集群上从头开始训练的第三个模型。它已经开发了9个月。V6不是最后一步,但我们希望大家都能感受到一些深刻的进展,这些进展与我们集体想象力的力量密切相关。
LLM大语言模型AI医生自学成长,无需人工标注数据就能超越人类医生水平 - Agent Hospital详解
独家整理,盗用必究近日,清华大学人工智能研究院(AIR)的研究团队发表了一篇引人注目的论文《Agent Hos










