超越了_第2页_深圳市千寻多信息科技有限公司

新闻资讯超越了

News

01 2025-05 碧海醫心 AI大模型

Xiaomi MiMo— 小米开源的首个推理大模型

XiaomiMiMo是什么XiaomiMiMo是小米推出的首个开源推理大模型，旨在提升模型在复杂推理任务中的表现。该模型通过联动预训练和后训练，利用大量富推理语料并应用创新的强化学习算法，显著增强了其数学推理和代码生成能力。尽管仅有7B参数，MiMo在公开测评集上的表现超越了OpenAI的o1-mini和阿里Qwen的...

阅读全文 >> 162
31 2025-03 DDD AI大模型

DistilQwen2.5-R1— 阿里推出的小型系列深度推理模型

阿里巴巴推出全新轻量级推理模型：DistilQwen2.5-R1DistilQwen2.5-R1是阿里巴巴基于知识蒸馏技术打造的一系列小型化深度推理模型，涵盖3B、7B、14B和32B四个参数量级。该模型将大型模型（例如DeepSeek-R1）的强大推理能力压缩到更小的体积，从而实现更高的计算效率和更低的资源消耗，非常...

阅读全文 >> 1971
27 2025-03 看不見的法師 AI大模型

中美AI模型争霸鸿海、广达等迎服务器建置潮

AI大模型竞争日益白热化，OpenAI和Google近期分别发布了升级版AI模型。OpenAI推出了GPT-4o系统升级版，具备原生图像生成能力；Google则发布了号称“最强”的Gemini2.5模型，拥有强大的推理能力。DeepSeek也同步更新了V3大语言模型，显著提升了推理能力，直接挑战OpenAI的GPT-4...

阅读全文 >> 145
26 2025-03 霞舞 AI大模型

Qwen2.5-VL-32B— 阿里开源的最新多模态模型

阿里巴巴开源的Qwen2.5-VL-32B：一款320亿参数的多模态语言模型Qwen2.5-VL-32B是阿里巴巴最新推出的开源多模态模型，其参数规模达到320亿。它在Qwen2.5-VL系列的基础上，通过强化学习进行了优化，展现出更贴近人类偏好的回答风格、显著提升的数学推理能力以及更强的图像细粒度理解和推理能力。在多...

阅读全文 >> 424
01 2025-03 心靈之曲网络技术

摆脱编码器依赖！Encoder-free 3D 多模态大模型，性能超越 13B

突破性进展：无编码器3D多模态大模型ENEL问世！这项由上海AILab、西北工业大学、香港中文大学和清华大学等机构联合研发的ENEL模型，将无编码器多模态大模型拓展到了3D领域，实现了对不同点云分辨率的适应性，并彻底摆脱了对预训练编码器的依赖。ENEL在Objaverse基准测试中表现卓越，性能超越了当前最先进的Sha...

阅读全文 >> 1849
25 2025-02 碧海醫心 AI大模型

仅靠逻辑题，AI数学竞赛能力飙升！微软、九坤投资：7B小模型也能逼近o3-min

仅靠逻辑益智题，竟能让AI数学竞赛水平大幅提升？DeepSeekR1的秘密武器继中国大模型在技术领域取得突破后，国内团队再次带来惊喜！这项研究揭秘了DeepSeekR1模型背后的秘密：通过少量合成数据和强化学习，一个7B参数的小模型在逻辑推理测试中超越了OpenAI的o1模型，甚至逼近o3-mini-high的水平。更...

阅读全文 >> 1944
18 2025-02 霞舞 AI大模型

20万张GPU！马斯克掏出「地表最强」大模型Grok-3，排行榜登顶，复仇Ope

马斯克旗下xAI公司重磅推出全新旗舰大模型Grok3！直播首秀吸引百万观众在线围观，马斯克本人也亲临现场，主题直指“理解宇宙”。Grok3并非单一模型，而是一个系列，包含更快速的轻量级版本Grok3mini（牺牲部分准确性换取速度）。目前并非所有版本都已上线，但将陆续推出。马斯克豪言Grok3性能比前代提升十倍，并使用...

阅读全文 >> 375
30 2025-01 聖光之護 AI大模型

ICLR 2025｜大模型也需要好奇心，TeleAI 提出探索驱动的对齐方法，8

基于探索驱动的大模型对齐方法COPO：赋予LLM探索能力，突破性能边界AIxiv专栏持续报道全球顶尖AI研究成果。如果您有优秀的研究成果，欢迎投稿至liyazhou@jiqizhixin.com或zhaoyunfeng@jiqizhixin.com。自然界生物的探索精神驱动着进化，人类亦是如此。在人工智能领域，尤其大型...

阅读全文 >> 1419

联络方式：

400 9058 355

邮箱：8955556@qq.com

Q Q：8955556

微信二维码

400 9058 355

新闻资讯超越了

Xiaomi MiMo— 小米开源的首个推理大模型

DistilQwen2.5-R1— 阿里推出的小型系列深度推理模型

中美AI模型争霸鸿海、广达等迎服务器建置潮

Qwen2.5-VL-32B— 阿里开源的最新多模态模型

摆脱编码器依赖！Encoder-free 3D 多模态大模型，性能超越 13B

仅靠逻辑题，AI数学竞赛能力飙升！微软、九坤投资：7B小模型也能逼近o3-min

20万张GPU！马斯克掏出「地表最强」大模型Grok-3，排行榜登顶，复仇Ope

ICLR 2025｜大模型也需要好奇心，TeleAI 提出探索驱动的对齐方法，8

猜你喜欢

联络方式：

400 9058 355

客服QQ

新闻资讯 超越了

猜你喜欢

联络方式：

400 9058 355

客服QQ

新闻资讯超越了