ChatGPT的Strawberry更新可以让聊天机器人自行进行研究
ChatGPT是我最常用的生成式AI聊天机器人,而且我碰巧也为Plus订阅付费,尽管免费套餐可以让我访问聊天机器人的大部分功能。我还碰巧使用了GPT-4o,这是OpenAI最新、最好的ChatGPT模型。但我不能说我对GPT-4o能为我做的事情完全满意,我迫不及待地希望OpenAI能修复它。
我最讨厌GPT-4o的地方是它产生反应的速度。这些反应可能是错误的,需要纠正。我希望它能慢一点,讲道理。
当我告诉聊天机器人它犯了一个或几个错误时,它并不总是立即纠正这些错误。也就是说,纠正的结果仍然是错误的。从它那里获取正确的信息可能需要几次提醒。当我告诉它信息不准确时,它并不总是会进行互联网搜索。
我试着坚持下去,因为它教会了我如何更好地与人工智能聊天机器人互动,同时我等待OpenAI改进GPT-4o。现在我听说了所谓的Strawberry升级,我迫不及待地想让OpenAI将其部署到ChatGPT中。它不能消除所有的幻觉,但如果传言属实,Strawberry可能会赋予ChatGPT推理的能力。
Strawberry代号源自路透社的一份报道,该报道基于一份据称至少可追溯至5月份的OpenAI内部文件。
据消息人士透露,Strawberry是一项正在进行中的工作,甚至在OpenAI内部也处于保密状态。Strawberry模型将让ChatGPT提前规划并自主可靠地浏览互联网,以进行“深度研究”操作。
这对ChatGPT用户来说是个好消息。我希望从ChatGPT互动中获得“深入研究”,尤其是那些可能需要多次复杂的互联网搜索的问题。
据路透社报道,Strawberry是ChatGPTQ*的演化版本,后者是SamAltman被解雇前后出现在网上的内部代号,当时被形容为AI的重大突破。
报告指出,今年早些时候,有两位消息人士见证了ChatGPT的Q*版本实际运行。该模型回答了当前聊天机器人“无法解决”的“棘手科学和数学问题”。另一位消息人士称,OpenAI测试的AI在MATH数据集上得分超过90%,但目前尚不清楚这是否是同一个Strawberry项目。
彭博社的一篇报道似乎证实了路透社的报道,该报道详细介绍了本周OpenAI的一次内部全体会议,该公司在会上演示了一个具有“类人推理”能力的项目。目前尚不清楚这是否是Strawberry。
OpenAI还为员工提供了一套新的AI模型分类系统。第1级是现在可以通过ChatGPT等方式体验的AI类型。第5级是能够执行整个组织工作的AI。
有趣的是,第人工智能可以花几天时间为用户采取行动。第四级人工智能可以自行创新。
彭博社的报道中没有出现Strawberry的代号。但路透社看到的Strawberry文件中似乎确实出现了上述的Level3代号:
该文件称,OpenAI为Strawberry瞄准的功能之一是执行长期任务(LHT),指的是需要模型提前规划并在较长时间内执行一系列操作的复杂任务,第一位消息人士解释说。
OpenAI正在用一个神秘的“深度研究”数据集训练这些模型。结果将是一个ChatGPT版本,它可以通过计算机使用代理(CUA)自主研究网络,然后根据研究结果采取行动。
OpenAI希望在软件和机器学习工程师的工作上测试这些模型。这实际上可能导致人工智能训练和开发未来的人工智能变体,从而走向AGI或通用人工智能。目前这只是我个人的猜测。但正如报告所指出的,AGI是当前人工智能研究的圣杯。
路透社还介绍了Strawberry的训练方式。这不仅仅是尽可能多地吸收数据。OpenAI还使用了一种后训练方法来改进人工智能。该技术使用“微调”,即人类向人工智能提供反馈的过程。
此外,Strawberry与斯坦福大学2022年开发的一种方法类似。它被称为“自学推理机”或STaR。这允许人工智能通过创建自己的数据来训练自己,使其具备更高的智能。
Strawberry何时才能投入大众消费?路透社称,OpenAI近几个月来一直在告诉开发者和其他各方,它“即将”发布具有改进推理能力的人工智能。虽然目前还不清楚今年我们是否会获得任何ChatGPT升级,但人工智能行业的发展速度非常快。OpenAI被迫尽快部署新的创新。
如果Strawberry变成ChatGPT5,我不会感到惊讶,但我再次猜测。我还准备在等待下一次升级的同时继续纠正GPT-4o。