新闻资讯 超越了

News

  • 01 2025-05 碧海醫心 AI大模型

    Xiaomi MiMo— 小米开源的首个推理大模型

    XiaomiMiMo是什么XiaomiMiMo是小米推出的首个开源推理大模型,旨在提升模型在复杂推理任务中的表现。该模型通过联动预训练和后训练,利用大量富推理语料并应用创新的强化学习算法,显著增强了其数学推理和代码生成能力。尽管仅有7B参数,MiMo在公开测评集上的表现超越了OpenAI的o1-mini和阿里Qwen的...

  • 31 2025-03 DDD AI大模型

    DistilQwen2.5-R1— 阿里推出的小型系列深度推理模型

    阿里巴巴推出全新轻量级推理模型:DistilQwen2.5-R1DistilQwen2.5-R1是阿里巴巴基于知识蒸馏技术打造的一系列小型化深度推理模型,涵盖3B、7B、14B和32B四个参数量级。该模型将大型模型(例如DeepSeek-R1)的强大推理能力压缩到更小的体积,从而实现更高的计算效率和更低的资源消耗,非常...

  • 27 2025-03 看不見的法師 AI大模型

    中美AI模型争霸 鸿海、广达等迎服务器建置潮

    AI大模型竞争日益白热化,OpenAI和Google近期分别发布了升级版AI模型。OpenAI推出了GPT-4o系统升级版,具备原生图像生成能力;Google则发布了号称“最强”的Gemini2.5模型,拥有强大的推理能力。DeepSeek也同步更新了V3大语言模型,显著提升了推理能力,直接挑战OpenAI的GPT-4...

  • 26 2025-03 霞舞 AI大模型

    Qwen2.5-VL-32B— 阿里开源的最新多模态模型

    阿里巴巴开源的Qwen2.5-VL-32B:一款320亿参数的多模态语言模型Qwen2.5-VL-32B是阿里巴巴最新推出的开源多模态模型,其参数规模达到320亿。它在Qwen2.5-VL系列的基础上,通过强化学习进行了优化,展现出更贴近人类偏好的回答风格、显著提升的数学推理能力以及更强的图像细粒度理解和推理能力。在多...

  • 01 2025-03 心靈之曲 网络技术

    摆脱编码器依赖!Encoder-free 3D 多模态大模型,性能超越 13B

    突破性进展:无编码器3D多模态大模型ENEL问世!这项由上海AILab、西北工业大学、香港中文大学和清华大学等机构联合研发的ENEL模型,将无编码器多模态大模型拓展到了3D领域,实现了对不同点云分辨率的适应性,并彻底摆脱了对预训练编码器的依赖。ENEL在Objaverse基准测试中表现卓越,性能超越了当前最先进的Sha...

  • 25 2025-02 碧海醫心 AI大模型

    仅靠逻辑题,AI数学竞赛能力飙升!微软、九坤投资:7B小模型也能逼近o3-min

    仅靠逻辑益智题,竟能让AI数学竞赛水平大幅提升?DeepSeekR1的秘密武器继中国大模型在技术领域取得突破后,国内团队再次带来惊喜!这项研究揭秘了DeepSeekR1模型背后的秘密:通过少量合成数据和强化学习,一个7B参数的小模型在逻辑推理测试中超越了OpenAI的o1模型,甚至逼近o3-mini-high的水平。更...

  • 18 2025-02 霞舞 AI大模型

    20万张GPU!马斯克掏出「地表最强」大模型Grok-3,排行榜登顶,复仇Ope

    马斯克旗下xAI公司重磅推出全新旗舰大模型Grok3!直播首秀吸引百万观众在线围观,马斯克本人也亲临现场,主题直指“理解宇宙”。Grok3并非单一模型,而是一个系列,包含更快速的轻量级版本Grok3mini(牺牲部分准确性换取速度)。目前并非所有版本都已上线,但将陆续推出。马斯克豪言Grok3性能比前代提升十倍,并使用...

  • 30 2025-01 聖光之護 AI大模型

    ICLR 2025|大模型也需要好奇心,TeleAI 提出探索驱动的对齐方法,8

    基于探索驱动的大模型对齐方法COPO:赋予LLM探索能力,突破性能边界AIxiv专栏持续报道全球顶尖AI研究成果。如果您有优秀的研究成果,欢迎投稿至liyazhou@jiqizhixin.com或zhaoyunfeng@jiqizhixin.com。自然界生物的探索精神驱动着进化,人类亦是如此。在人工智能领域,尤其大型...

猜你喜欢

联络方式:

400 9058 355

邮箱:8955556@qq.com

Q Q:8955556

微信二维码
在线咨询 拨打电话

电话

400 9058 355

微信二维码

微信二维码