全息甲板

一个带有蓝色发光网络连接的机械臂正在用 3D 打印机打印一个白色螺旋形物体。物体

我来自最后的模拟时代。磁性和机械数据存储对我有着某种特殊的吸引力。

而且我知道铅笔和磁带之间是怎么回事。

白色背景上的透明磁带(带有棕色磁带条)和黄色铅笔。磁带上标有字母
Von: Kay Helena

与此同时,我生活在一个即使没有人工智能,过去 40 年的进步也完全令人疯狂的时代。现在的手机在以前曾是大型计算机。知识在任何时间、任何地点都过剩。数字化使合作的规模和速度达到了以前梦寐以求的程度。

到目前为止,在我的生活中,当我想要做某事但还不会做时,我会去学习各种东西。别无他法——而且我觉得这样也挺好。它让生活变得更有趣。

但自从人工智能广泛普及以来,我们有了一个有趣的新选择:我们可以去做那些我们根本不再需要理解就能完成的事情。

这有点像进取号 NCC 1751-D 的全息甲板:我们说出想要什么——它就会呈现在我们眼前。

技术平台上的地球未来派全息图展示及数据可视化。数字界面
Von: Kay Helena (mit KI generiert)

从本质上讲,除了作为知识和信息来源的互联网之外,我现在可以将人工智能作为可能性和方法的来源——并从中学习。

我在下面附上了证据。一个 Pong 游戏,你可以和一个笨得要命的神经网络对战。这个网络起初不知道该做什么——但成功的行为会得到奖励。
一个遗传算法作用于这个网络,使神经网络经历进化,到最后它依然很笨——但却能击败你。

我以前对神经网络和遗传算法都一窍不通。现在也谈不上精通——但我现在可以想象它们是什么并进行实验——因为人工智能让我免于去学习那些我在日常生活或谋生中都不需要、但却是进行此类实验所必需的东西。

我现在有了一个 WordPress 插件开发环境,所以我可以利用它及其子代理和预设(这也是一个学习过程)。

最初的任务是:

编写一个 Gutenberg 区块((我可以在 WordPress 中使用并插入到这篇文章中的组件)),用于演示神经网络和遗传算法。一个演示程序。我建议让一个网络与人类玩家进行 Pong 游戏,并根据成功程度通过遗传算法进行进化。
制定一个计划并与我讨论。批准后,你将与你的子代理一起处理该任务,直到按计划衡量的完成度达到 100%。你自主工作——Token 限制为 500 万。你在开始时提问——除非没有答案就无法完成任务,否则不再提问。针对缺失的知识使用高质量来源。不允许推测。

我该怎么说呢。成功了。这还包括一个庞大的系统提示词、一个上下文管理器、各种准则……但我就不让大家看这些了。

第一个结果在 25 分钟后就已经出现并可以运行了。
调试还花了一点时间。由于缺乏深入的知识,我也让人工智能去做了。

现在,我可以通过更改程序或参数来尝试这在神经网络中会产生什么效果,以及遗传算法是如何运作的。
关于这些,我依然“知道”得不多……但我有了一个更具体的概念。

神经网络

左侧
右侧
代际0
最佳
平均
多样性
死亡
FPS

顶级代理

适应度历史

遗传多样性

它是如何运作的?

神经网络

每个 AI 代理都有一个具有 10 个输入值的神经网络:对手 Y 坐标、对手速度、自身球拍 Y 坐标、自身速度、与顶边和底边的距离、球 X 坐标、球 Y 坐标、球 X 速度、球 Y 速度。作为输出,它通过加速度(而非直接速度)控制球拍。

批量训练 + 展示

在每一代中,所有代理首先进行无界面对战(不可见,立即完成)。之后,表现最好的两个代理进行一场可见的展示赛。只有在展示赛结束后,下一代才会开始。

适应度 = 反弹次数

适应度衡量代理击球回来的次数。反弹次数为零的代理被视为“死亡”,在下一代中将不予考虑。

遗传算法

适应度最高的代理存活并允许繁衍。选择伴侣时,会选择那些既适应度高且遗传差异尽可能大的个体——这样可以保持种群的多样性并加快学习速度。

最佳基因组
Kay Helena 的头像

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注