全息甲板

我来自最后的模拟时代。磁性和机械数据存储对我有着某种特殊的吸引力。

而且我知道铅笔和磁带之间是怎么回事。

白色背景上的透明磁带（带有棕色磁带条）和黄色铅笔。磁带上标有字母 — Von: Kay Helena

与此同时，我生活在一个即使没有人工智能，过去 40 年的进步也完全令人疯狂的时代。现在的手机在以前曾是大型计算机。知识在任何时间、任何地点都过剩。数字化使合作的规模和速度达到了以前梦寐以求的程度。

到目前为止，在我的生活中，当我想要做某事但还不会做时，我会去学习各种东西。别无他法——而且我觉得这样也挺好。它让生活变得更有趣。

但自从人工智能广泛普及以来，我们有了一个有趣的新选择：我们可以去做那些我们根本不再需要理解就能完成的事情。

这有点像进取号 NCC 1751-D 的全息甲板：我们说出想要什么——它就会呈现在我们眼前。

技术平台上的地球未来派全息图展示及数据可视化。数字界面 — Von: Kay Helena (mit KI generiert)

从本质上讲，除了作为知识和信息来源的互联网之外，我现在可以将人工智能作为可能性和方法的来源——并从中学习。

我在下面附上了证据。一个 Pong 游戏，你可以和一个笨得要命的神经网络对战。这个网络起初不知道该做什么——但成功的行为会得到奖励。
一个遗传算法作用于这个网络，使神经网络经历进化，到最后它依然很笨——但却能击败你。

我以前对神经网络和遗传算法都一窍不通。现在也谈不上精通——但我现在可以想象它们是什么并进行实验——因为人工智能让我免于去学习那些我在日常生活或谋生中都不需要、但却是进行此类实验所必需的东西。

我现在有了一个 WordPress 插件开发环境，所以我可以利用它及其子代理和预设（这也是一个学习过程）。

最初的任务是：

编写一个 Gutenberg 区块（（我可以在 WordPress 中使用并插入到这篇文章中的组件）），用于演示神经网络和遗传算法。一个演示程序。我建议让一个网络与人类玩家进行 Pong 游戏，并根据成功程度通过遗传算法进行进化。
制定一个计划并与我讨论。批准后，你将与你的子代理一起处理该任务，直到按计划衡量的完成度达到 100%。你自主工作——Token 限制为 500 万。你在开始时提问——除非没有答案就无法完成任务，否则不再提问。针对缺失的知识使用高质量来源。不允许推测。

我该怎么说呢。成功了。这还包括一个庞大的系统提示词、一个上下文管理器、各种准则……但我就不让大家看这些了。

第一个结果在 25 分钟后就已经出现并可以运行了。
调试还花了一点时间。由于缺乏深入的知识，我也让人工智能去做了。

现在，我可以通过更改程序或参数来尝试这在神经网络中会产生什么效果，以及遗传算法是如何运作的。
关于这些，我依然“知道”得不多……但我有了一个更具体的概念。

神经网络

左侧

右侧

代际0

最佳—

平均—

多样性—

死亡—

FPS—

顶级代理

适应度历史

遗传多样性

它是如何运作的？

神经网络

每个 AI 代理都有一个具有 10 个输入值的神经网络：对手 Y 坐标、对手速度、自身球拍 Y 坐标、自身速度、与顶边和底边的距离、球 X 坐标、球 Y 坐标、球 X 速度、球 Y 速度。作为输出，它通过加速度（而非直接速度）控制球拍。

批量训练 + 展示

在每一代中，所有代理首先进行无界面对战（不可见，立即完成）。之后，表现最好的两个代理进行一场可见的展示赛。只有在展示赛结束后，下一代才会开始。

适应度 = 反弹次数

适应度衡量代理击球回来的次数。反弹次数为零的代理被视为“死亡”，在下一代中将不予考虑。

遗传算法

适应度最高的代理存活并允许繁衍。选择伴侣时，会选择那些既适应度高且遗传差异尽可能大的个体——这样可以保持种群的多样性并加快学习速度。

最佳基因组

神经网络

顶级代理

适应度历史

遗传多样性

神经网络

批量训练 + 展示

适应度 = 反弹次数

遗传算法

评论

发表回复

更多帖子

路边的春天

脚下的自然

关于国际妇女节的思考

捡垃圾