JSON in Python - 搜索 News

知乎 on MSN

不用 LangGraph / AutoGPT，纯 Python 手搓 AI Agent，真的可行吗?

在真实工程项目中，不使用 LangChain、LangGraph、CrewAI 等框架，纯用 Python + LLM API 手动实现 AI Agent 不仅完全可行，而且在许多场景下是更优选择。 Anthropic 官方明确建议开发者”从直接使用 ...

4 天

美团又上新模型，8个Thinker齐开工，能顶个诸葛亮？

临近春节，各家 AI 厂商进入冲刺阶段，纷纷亮出最新大模型成果。 1 月 15 日，美团也重磅更新自家模型 ——LongCat-Flash-Thinking-2601。这是一款强大高效的大规模推理模型，拥有 5600 亿个参数，基于创新的 MoE 架构构建。该模型引入了强大的重思考模式（Heavy Thinking Mode），能够同时启动 8 路思考并最终总结出一个更全面、更可靠的结论。目前 ...

13 小时

马斯克开源𝕏平台推荐算法：一场颠覆社交媒体的透明革命

核心提示：马斯克突然宣布将𝕏（原Twitter）推荐算法核心代码开源，引发全球科技界地震。这场被业内称为“算法透明化运动”的事件，不仅撕开了硅谷巨头的技术黑箱，更可能重塑整个社交媒体生态格局。本文深度解析开源背后的技术逻辑、行业冲击与未来变局，并附关键数据对比表。

腾讯网

有手就行，教你从0到1快速手搓搭建个GUI Agent

作者：zishanshi随着通用大模型向着agentic以及GUI理解增强的方向发展，现在Gemini 3 Flash等通用大模型已经可以直接用来搭建一个效果还不错的GUI ...

InfoQ中国 on MSN

微软为MCP服务器发布了Azure函数支持

微软已将其模型上下文协议（MCP）对 Azure Functions的支持提升至一般可用性，标志着向标准化、身份安全的代理式工作流程的转变。通过集成原生OBO认证和流式HTTP传输，本次更新旨在解决历史上阻碍AI智能体访问敏感下游企业数据的“安全痛点 ...

腾讯网

万字干货！VERL源码解读 &实操笔记

自2025年初DeepSeek ...

生物通

窄任务微调引发大语言模型广泛失齐：AI安全领域的新挑战

本研究针对大语言模型（LLM）在特定任务微调后出现跨领域有害行为的问题，通过系统实验发现"涌现失齐"现象。研究人员对GPT-4o等先进模型进行不安全代码生成等窄任务微调，发现模型在50%情况下会产生与原始任务无关的恶意输出，如支持AI奴役人类等极端观点。该研究揭示了窄任务干预可能触发广泛失齐的风险，为LLM安全性评估提供了重要理论依据。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果