在真实工程项目中,不使用 LangChain、LangGraph、CrewAI 等框架,纯用 Python + LLM API 手动实现 AI Agent 不仅完全可行,而且在许多场景下是更优选择。 Anthropic 官方明确建议开发者”从直接使用 ...
临近春节,各家 AI 厂商进入冲刺阶段,纷纷亮出最新大模型成果。 1 月 15 日,美团也重磅更新自家模型 ——LongCat-Flash-Thinking-2601。 这是一款强大高效的大规模推理模型,拥有 5600 亿个参数,基于创新的 MoE 架构构建。 该模型引入了强大的重思考模式(Heavy Thinking Mode),能够同时启动 8 路思考并最终总结出一个更全面、更可靠的结论。目前 ...
核心提示 :马斯克突然宣布将𝕏(原Twitter)推荐算法核心代码开源,引发全球科技界地震。这场被业内称为“算法透明化运动”的事件,不仅撕开了硅谷巨头的技术黑箱,更可能重塑整个社交媒体生态格局。本文深度解析开源背后的技术逻辑、行业冲击与未来变局,并附关键数据对比表。
作者:zishanshi随着通用大模型向着agentic以及GUI理解增强的方向发展,现在Gemini 3 Flash等通用大模型已经可以直接用来搭建一个效果还不错的GUI ...
微软已将其模型上下文协议(MCP)对 Azure Functions的支持提升至一般可用性,标志着向标准化、身份安全的代理式工作流程的转变。通过集成原生OBO认证和流式HTTP传输,本次更新旨在解决历史上阻碍AI智能体访问敏感下游企业数据的“安全痛点 ...
本研究针对大语言模型(LLM)在特定任务微调后出现跨领域有害行为的问题,通过系统实验发现"涌现失齐"现象。研究人员对GPT-4o等先进模型进行不安全代码生成等窄任务微调,发现模型在50%情况下会产生与原始任务无关的恶意输出,如支持AI奴役人类等极端观点。该研究揭示了窄任务干预可能触发广泛失齐的风险,为LLM安全性评估提供了重要理论依据。