深趣

GRPO在《时空谜题》中击败o1、o3

近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别为来自 Ender Resear ...

清程极智 CEO 汤雄超:训推一体机并非 AI Infra 的未来

早在超算时代,清华大学高性能计算研究中心便一直是解决算力需求相关软件问题的行家。“目前 AI Infra 赛道几家国内厂商中,只有我们有过十万台服务器的超大规模国产算力集群的使用和调优经验。”汤雄超向 ...

中国青年电影人在戛纳受到瞩目

来源标题:中国青年电影人在戛纳受到瞩目新华社法国戛纳5月24日电记者邢建桥)第78届戛纳国际电影节24日晚在法国南部城市戛纳闭幕。电影节期间,中国青年导演以先锋视角诠释东方美学,用电影语言打破文化边界 ...

Kimi 数理化能跟 o1 掰手腕了?新模型 k1 有点儿强

「雷峰网(公众号:雷峰网)消息」今天,月之暗面官方宣布:继 11 月 16 日发布数学模型 k0-math 后,他们又推出了新的视觉思考模型 k1,且「数理化」的能力又上了一个新台阶,实测结果丝毫不输 ...

AI Infra 往事之异构计算篇:吴韧与他的学生们

2013年9月底,吴韧受百度邀请,以杰出科学家的身份加入百度深度学习研究院IDL),此时正值他五十知天命的年纪。吴韧在人工智能领域耕耘多年,当时已是一名顶尖的AI计算科学家。2012年深度学习崛起前后 ...
我要啦免费统计