全秀

GRPO在《时空谜题》中击败o1、o3

近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别为来自 Ender Resear ...

月之暗面发布首款数学模型 k0

今天,在京东科技大厦,月之暗面创始人杨植麟宣布 Kimi 数学模型 k0-math 正式发布,其数学能力对标OpenAI o1系列,还公布了截止2024年10月 Kimi 月活超过 3600万。杨植麟 ...

Kimi 数理化能跟 o1 掰手腕了?新模型 k1 有点儿强

「雷峰网(公众号:雷峰网)消息」今天,月之暗面官方宣布:继 11 月 16 日发布数学模型 k0-math 后,他们又推出了新的视觉思考模型 k1,且「数理化」的能力又上了一个新台阶,实测结果丝毫不输 ...

黑客大会遇上元宇宙:极客精神的又一次狂欢

1993年的拉斯维加斯,18岁的 Jeff Moss 正准备面临一场悲伤的别离。他的一位黑客朋友由于爸爸工作调动即将离开美国,为了给这份友谊再留下些纪念,Jeff 决定给朋友办一个盛大的告别 Part ...
我要啦免费统计