为了防止大模型“产生幻觉”或开得太激进,轻舟引入了 Rule Critics(规则评价器)。这意味着模型生成的轨迹必须符合安全规则(如不撞人、不压实线)。这是将 AI 的灵活性与传统控制的安全性相结合。
最近, LightOn 在文档理解领域推出了名为 LightOnOCR-2-1B 的全新模型。这个模型仅用10亿的参数量,就在权威的 OCR 评测基准 OlmOCR-Bench ...
【新智元导读】谷歌 DeepMind 发布 D4RT,彻底颠覆了动态 4D 重建范式。它抛弃了复杂的传统流水线,用一个统一的「时空查询」接口,同时搞定全像素追踪、深度估计与相机位姿。不仅精度屠榜,速度更比现有 SOTA 快出 300 ...
基于上述问题,快手在业界首次提出端到端的生成式统一查询推荐框架 ——OneSug,成功将召回、粗排、精排等多个阶段统一在一个生成模型中,显著提升了推荐效果与系统效率,在快手电商场景中实现了业务指标与用户体验的双重提升。
自动驾驶赛道,2026公认关键词之一,就是——收敛。 技术上,多模态大模型、数据驱动、强化学习等新范式,展现出阶段性“终局”特性:统一L2+、L4的技术方案,正在被越来越多的玩家押注。
some analysis to understand the behaviors of streaming S2S models.
先说下我的经历,有6年大厂算法工程师的经验,2022年前主要做CV和NLP,2023年全面转向大模型方向。平均每年负责三个大模型相关项目,也参与组内其他项目。无论是作为面试官还是候选人,这前前后后的经历我都积累了不少。今天纯粹是个人经验分享,没有任何广告,可能带有我的个人视角,大家批判参考就好。
在人工智能深度学习技术与物理化学分析技术不断融合的当下,一项由国内领先科技企业微云全息(NASDAQ:HOLO)自主创新技术——基于Masked预训练Transformer的红外光谱反卷积算法,近日引起了科研界和产业界的广泛关注。