风报潮

GRPO在《时空谜题》中击败o1、o3

近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别为来自 Ender Resear ...

超4.42亿!端午档票房很给力

来源标题:超4.42亿!端午档票房很给力根据猫眼专业版数据,截至6月2日18时,2025年端午档5月31日至6月2日)电影票房超过4.42亿元,较去年热度提升,为今年暑期档开了一个好头。票房方面,《碟 ...

世界夫人蔡保梅戛纳演绎东方优雅

来源标题:世界夫人蔡保梅戛纳演绎东方优雅【戛纳讯】当地时间2025年5月19日,第78届戛纳国际电影节的红毯上,一位身着旗袍的东方女性吸引了全球目光——她是中国女企业家、世界夫 ...

别再声讨零一万物了

最近两天,由原阿里技术副总裁、深度学习框架 Caffe 发明者贾扬清一则朋友圈引发的关于“国内某大厂新模型套壳 LLaMA 架构”的问题在中国人工智能圈与科技媒体中产生了热烈讨论。由于贾扬清在国内 A ...
我要啦免费统计