Str.replace Python - 搜索 News

用 PyTorch 实现 LLM-JEPA：不预测 token，预测嵌入

点击上方“Deephub Imba”,关注公众号,好文章不错过 !这篇文章从头实现 LLM-JEPA: Large Language Models Meet Joint Embedding Predictive Architectures。需要说明的是，这里写的是一个简洁的最小化训练脚本，目标是了解 JEPA 的本质：对同一文本创建两个视图，预测被遮蔽片段的嵌入，用表示对齐损失来训练。本文的目标是 ...

5 天

微软和人大：让AI在虚拟计算机里"折腾"，智能水平竟然飙升了

这就好比我们突然发现，原本只会纸上谈兵的军师，一旦给了他一套完整的作战工具，立刻就能指挥千军万马。研究结果显示，不同的AI模型在获得沙盒环境后，性能提升幅度从1%到24%不等，这在AI领域算是相当可观的进步。

1 天

LLM-in-Sandbox：给大模型一台电脑，激发通用智能体能力

LLM-in-Sandbox 提出了一个简洁而有效的范式：通过给大模型提供一台虚拟电脑，让其自由探索来完成任务。实验表明，这一范式能够显著提升模型在非代码领域的表现，且无需额外训练。研究者认为， LLM-in-Sandbox 应当成为大模型的默认部署范式，取代纯 LLM 推理。当沙盒可以带来显著的性能提升，并且部署成本几乎可以忽略不计时，为什么还要用纯 LLM？

腾讯网

微软和人大联合突破：让AI在虚拟计算机里“折腾”，智能水平竟然 ...

这就好比我们突然发现，原本只会纸上谈兵的军师，一旦给了他一套完整的作战工具，立刻就能指挥千军万马。研究结果显示，不同的AI模型在获得沙盒环境后，性能提升幅度从1%到24%不等，这在AI领域算是相当可观的进步。