chatgpt 中文会取代搜索引擎吗?

欢迎来到小白测评,我会每天为您推送科技数码产品资讯,和大家交流科技圈的信息。

觉得文章不错,微信扫描分享好友

试着和 ChatGPT 聊了几句,它把我的问题解决了。

当每个人都在苦苦等待 GPT-4 发布时,OpenAI 却一直迟迟没有消息,仍在修复其前身。这家总部位于旧金山的公司于昨日发布了一个名为 ChatGPT 的新模型,它是 GPT-3 的衍生产品,它以对话的方式进行交互。

这种对话允许 ChatGPT 回答后续问题,承认错误,挑战不正确的前提,并拒绝不适当的请求。不同于别的语言模型胡编乱造,例如 Meta 的语言模型 Galactica 因为不负责任的胡编乱造,上线几天就下架了。ChatGPT 的不同之处在于,当它不知道自己在说什么时,它承认不知道。此外,ChatGPT 拒绝回答它没有受过训练的问题,例如,它不会试图回答有关 2022 年之后发生的事件的问题。它也不会回答关于个人的问题。

这个模型到底有多智能?以前调试代码的脑力活都得程序员亲自动手,现在 ChatGPT 可以揽下这个苦差事。

用户表示:这段代码没有像我期望的那样运行,我该如何修改?

ChatGPT:你给的上下文信息太少了,很难说出代码的问题。你能否提供更多关于代码的信息,比如代码用来干什么的,这是整个代码还是其中的一部分?

用户:这是代码的一部分。我认为 channel 出现了问题。

ChatGPT:如果没有更多信息来说明代码应该做什么、执行时发生了什么,这个问题就很难说了。从你提供的信息可以看出,代码的一个潜在问题是 resultWorkerErr channel 从未关闭,这意味着如果从未写入 resultWorkerErr channel,代码可能会挂起。如果

ChatGPT 使用与 InstructGPT 相同的方法——用人类反馈强化学习 (RLHF) 训练模型,但数据收集设置略有不同。ChatGPT 使用监督微调训练了一个初始模型:人类 AI 训练员提供对话,他们在对话中扮演双方——用户和 AI 助手,AI 训练员可以访问模型编写的对话回复,以帮助 AI 调整回复内容。

为了创建强化学习的奖励模型,该研究需要收集比较数据,其中包含两个或多个按质量排序的模型回复。该研究收集了 AI 训练员与聊天机器人的对话,并随机选择一条模型编写的消息,抽取几个备选回复,让 AI 训练员对这些回复进行排名。此外,该研究还使用近端策略优化算法(PPO)微调模型,并对整个过程进行了几次迭代。

1. ChatGPT 有时会写出看似合理但不正确或荒谬的答案。解决这个问题非常具有挑战性,因为:

RL 训练期间需要现实世界的数据,但目前没有来源; 

模型被训练得过于谨慎导致它拒绝回答可以正确回答的问题;(3) 监督训练会影响模型的性能,因为理想情况是模型知道正确答案是什么,而不是人类演示者知道是什么。

ChatGPT 对调整输入措辞或多次尝试相同的 prompt 很敏感。例如,给定一个问题,模型可以声称不知道答案,但只要对问题稍作改写,模型就就可以正确回答。

模型的回答通常过于冗长并过度使用某些短语,例如重申它是 OpenAI 训练的语言模型。这些问题源于训练数据(训练者喜欢看起来更全面的长答案)和过度优化。

理想情况下,当用户提供模棱两可的查询时,模型会提出质疑,然而 ChatGPT 目前是自行猜测用户的意图。

虽然该研究已努力使模型拒绝不当请求,但它有时会回复有害指令或给出有偏见的回答。研究团队正在使用 Moderation API 来警告模型或阻止某些类型的不安全内容,并试图收集用户反馈来进一步改进该系统的工作。

相比于 GPT-3 和 Codex,ChatGPT 作为 OpenAI 最新发布的模型,已经在安全性和可用性方面做出了诸多改进,汲取了先前模型的经验教训,并通过使用人类反馈强化学习 (RLHF) 大幅减少了模型的有害和不真实输出。

刚才实验了一个 Swift 里面比较麻烦的内购。

第一遍它生成的代码有误,如图 1,报错了两个细节问题,其实是 AI 的理解对于 class 和 struct 没有区分的 Runtime Error。如图 2,我和它说报错了,它给出了第一次修复,针对性的修好了这个报错,同时引入了一个新的小小错误。如图 3 和4,继续反馈给它,进行自我纠正后,代码完全正确了。它具备思考和自我修正的能力,并不一定直接给出正确答案,但已经非常准确了,只需要进行一丁点纠偏就行了,如过它手头有 Xcode 修好只是秒秒钟的问题。

它的思考过程和人类非常相似,令人震撼的好东西!不再需要很多程序员,现有产品进入自动维护周期,人类智慧被全面超越,的确是指日可待。

脑洞一下,这才是真正的人类进化呀。穿不过去的爱因斯坦罗森桥,从原理上需要基于量子点才能过得去。对于二位维感官,三维存在,只能活在正向流动时间轴四维切片的人类,是不可解的问题。除非过去的,是 AI。

chatGPT 还有诸如 Stable Diffusion 这样的好东西,让人看到曙光。能活在这样一个有趣的世界,看到这些新创造和突破,太不错了!

我要回帖

更多关于 chatgpt 中文 的文章

 

随机推荐