2025-04-21 10:56:00
o3编码直逼全球TOP 200人类选手,却存在一个致命问题:幻觉率高达33%,是o1的两倍。Ai2科学家直指,RL过度优化成硬伤。满血o3更强了,却也更爱「胡言乱语」了。OpenAI技术报告称,o3和o4-mini「幻觉率」远高于此前的推理模型,甚至超过了传统模型GPT-4o。根据PersonQA
2025-04-09 08:16:00
刚刚,一位AI公司CEO细细扒皮了关于Llama 4的五大疑点。甚至有圈内人表示,Llama 4证明Scaling已经结束了,LLM并不能可靠推理。但更可怕的事,就是全球的AI进步恐将彻底停滞。令人失望的Llama 4,只是前奏而已。接下来我们恐将看到——全球局势的改变,将彻底阻止AI进步!最近,一
2025-03-31 12:19:00
在漫威宇宙中,钢铁侠的AI管家贾维斯化身“超级秘书”,不仅负责斯塔克家族企业的运作,平常还是一个忠诚体贴的生活管家,甚至钢铁侠连生命安全都托付给了它。平安集团首席科学家肖京认为上述场景在未来可能会实现,“很多靠知识和经验提供专业服务的领域,未来很可能会是少数优秀专业人员来调教、指挥一群机器人,为客户