热料

GRPO在《时空谜题》中击败o1、o3

近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别为来自 Ender Resear ...

美国洛杉矶一隧道坍塌 15人被困

美国加利福尼亚州洛杉矶市消防局9日说,该市威尔明顿地区当日发生一起隧道坍塌事故,造成15人被困。目前搜救人员无法与受困人员取得联系,隧道塌方似乎损毁了通信线路。搜救人员表示,坍塌点距离隧道唯一入口处约 ...

Kimi 数理化能跟 o1 掰手腕了?新模型 k1 有点儿强

「雷峰网(公众号:雷峰网)消息」今天,月之暗面官方宣布:继 11 月 16 日发布数学模型 k0-math 后,他们又推出了新的视觉思考模型 k1,且「数理化」的能力又上了一个新台阶,实测结果丝毫不输 ...

刚刚,云天励飞上市!

ChatGPT的横空出世,重燃了人工智能赛道的火,一边是狂热投资者纷涌而至,一边是大国博弈下,国家战略层面的高度关注。最近,云天励飞CEO陈宁博士忙得不可开交,前脚接待了省级领导,后脚又赶去接待科技部 ...

实测丨年底了,我用 AI 做了一份年终总结。

去年11月,自由画布在百度世界大会上首次亮相,各种 AI 新招式也是吊足了人们的胃口。经过了一段时间的等待,我终于拿到了它的内测资格,成为了首批探索者。激动之余,我和自由画布的相关负责人讨教了一下用法 ...
我要啦免费统计