我来自最后的模拟时代。磁性和机械数据存储对我有着某种特殊的吸引力。
而且我知道铅笔和磁带之间是怎么回事。

与此同时,我生活在一个即使没有人工智能,过去 40 年的进步也完全令人疯狂的时代。现在的手机在以前曾是大型计算机。知识在任何时间、任何地点都过剩。数字化使合作的规模和速度达到了以前梦寐以求的程度。
到目前为止,在我的生活中,当我想要做某事但还不会做时,我会去学习各种东西。别无他法——而且我觉得这样也挺好。它让生活变得更有趣。
但自从人工智能广泛普及以来,我们有了一个有趣的新选择:我们可以去做那些我们根本不再需要理解就能完成的事情。
这有点像进取号 NCC 1751-D 的全息甲板:我们说出想要什么——它就会呈现在我们眼前。

从本质上讲,除了作为知识和信息来源的互联网之外,我现在可以将人工智能作为可能性和方法的来源——并从中学习。
我在下面附上了证据。一个 Pong 游戏,你可以和一个笨得要命的神经网络对战。这个网络起初不知道该做什么——但成功的行为会得到奖励。
一个遗传算法作用于这个网络,使神经网络经历进化,到最后它依然很笨——但却能击败你。
我以前对神经网络和遗传算法都一窍不通。现在也谈不上精通——但我现在可以想象它们是什么并进行实验——因为人工智能让我免于去学习那些我在日常生活或谋生中都不需要、但却是进行此类实验所必需的东西。
我现在有了一个 WordPress 插件开发环境,所以我可以利用它及其子代理和预设(这也是一个学习过程)。
最初的任务是:
编写一个 Gutenberg 区块((我可以在 WordPress 中使用并插入到这篇文章中的组件)),用于演示神经网络和遗传算法。一个演示程序。我建议让一个网络与人类玩家进行 Pong 游戏,并根据成功程度通过遗传算法进行进化。
制定一个计划并与我讨论。批准后,你将与你的子代理一起处理该任务,直到按计划衡量的完成度达到 100%。你自主工作——Token 限制为 500 万。你在开始时提问——除非没有答案就无法完成任务,否则不再提问。针对缺失的知识使用高质量来源。不允许推测。
我该怎么说呢。成功了。这还包括一个庞大的系统提示词、一个上下文管理器、各种准则……但我就不让大家看这些了。
第一个结果在 25 分钟后就已经出现并可以运行了。
调试还花了一点时间。由于缺乏深入的知识,我也让人工智能去做了。
现在,我可以通过更改程序或参数来尝试这在神经网络中会产生什么效果,以及遗传算法是如何运作的。
关于这些,我依然“知道”得不多……但我有了一个更具体的概念。
神经网络
顶级代理
适应度历史
遗传多样性
它是如何运作的?
神经网络
每个 AI 代理都有一个具有 10 个输入值的神经网络:对手 Y 坐标、对手速度、自身球拍 Y 坐标、自身速度、与顶边和底边的距离、球 X 坐标、球 Y 坐标、球 X 速度、球 Y 速度。作为输出,它通过加速度(而非直接速度)控制球拍。
批量训练 + 展示
在每一代中,所有代理首先进行无界面对战(不可见,立即完成)。之后,表现最好的两个代理进行一场可见的展示赛。只有在展示赛结束后,下一代才会开始。
适应度 = 反弹次数
适应度衡量代理击球回来的次数。反弹次数为零的代理被视为“死亡”,在下一代中将不予考虑。
遗传算法
适应度最高的代理存活并允许繁衍。选择伴侣时,会选择那些既适应度高且遗传差异尽可能大的个体——这样可以保持种群的多样性并加快学习速度。


发表回复