什么会扰乱生成人工智能的未来？

已发表: 2023-09-22

最近有很多关于生成式人工智能如何让人们失业的讨论。人们并没有过多地思考如何让生成式人工智能失业。但他们可以——而且很可能会。

GenAI 及其所依赖的基础模型目前正处于 Gartner 技术成熟度曲线的令人眼花缭乱的高峰。如果 Gartner 的模型是合理的，那么这些工具可能会陷入“幻灭的低谷”，然后在几年后出现在有用生产力的平台上。

然而，有一种观点认为，幻灭的低谷可能会永远吞噬 genAI 产品。除了依赖本质上无意识和不道德的“智能”所蕴含的风险之外，用户还面临着版权和隐私问题可能对像 ChatGPT 这样的大型语言模型 (LLM) 造成致命伤害的现实前景。

让我们按顺序排列这些内容。

国家禁止刮擦登记册？

出版商通过内容获利。他们不会寻求让第三方在未经许可的情况下通过这些内容获利，尤其是出版商可能已经为此付费。专业作家将他们所写的内容货币化。他们也不寻求让第三方从他们的作品中获利而不向创作者提供任何报酬。我在这里所说的关于书面内容的所有内容同样适用于图形、视频和任何其他创意内容。

当然，我们确实有版权法，可以保护出版商和作者免遭直接盗窃。这些对 genAI 没有帮助，因为它抓取了如此多的来源，以至于最终的输出可能与单个来源之一不太相似（尽管这可能会发生）。

目前，出版商正在积极寻找阻止法学硕士抄袭其内容的方法。这是一项艰巨的技术挑战

在这段视频中，MarTech 撰稿人 Greg Krehbiel 讨论了出版商可能试图阻止法学硕士的方式。他还提出了修改条款和条件的理由，为未来的诉讼奠定基础。正如他似乎承认的那样，他的建议都不是一劳永逸的。例如，阻止 Google 抓取您的网站以获取内容而不停止 Google 抓取您的网站以将其放入搜索结果是否可行？此外，诉讼费用高昂。

但监管修复怎么样？您还记得电话营销电话带来的无尽烦恼吗？全国谢绝来电登记册阻止了这种情况。每个关心的人都可以注册他们的电话号码，而电话推销员只能冒着联邦贸易委员会处以巨额罚款的风险继续拨打该号码。

在国家禁止抓取注册机构中注册域名可能是一项艰巨的任务，但人们可以从一般意义上了解这种监管策略的运作方式。每一次侵权行为都会被发现吗？当然不是。但 GDPR 也是如此。 GDPR 要求遵守，并不是因为每一次侵权行为都会被发现，而是因为被发现的这些侵权行为可能会导致严厉制裁——“前所未有的高额罚款，高达公司全球总收入的 4%”。

太晚了。 GenAI 已经有数据了

无论是否有技术或监管修复来阻止 genAI 窃取内容，那匹马不是已经离开马厩了吗？法学硕士已经接受了令人难以置信的大数据集的培训。他们可能容易犯错误，但有一种他们无所不知的感觉。

好吧，他们几年前就知道一切了。 ChatGPT-4 使用截止日期为 2021 年 9 月的数据进行了预训练。这意味着有很多东西它不知道。让我们提醒自己我们正在处理什么。

深入挖掘：人工智能：初学者指南

GenAI 使用算法根据训练过的数百万条文本来预测要创建的下一个最佳文本。它之所以“智能”，是因为它可以根据反馈和响应改进自己的算法（人类不必修改算法，尽管她当然可以）。

genAI 不做（也不能做）的是找出其数据训练集之外的世界信息。这强调了唐纳德·戴维森 (Donald Davidson) ¹等哲学家提出的观点，即人工智能与世界没有因果关系。如果我想知道是否下雨，我不依赖数据集；而是依赖数据集。我看着窗外。从技术上来说，genAI 可能有很好的语法（语法），但它对语义（意义）却很陌生。

由此得出的结论是，人工智能完全依赖于像我们这样与世界存在因果关系的生物；谁能知道天上是否下雨、天上是否有月亮、杰斐逊是否起草了《独立宣言》。到目前为止，这取决于人们过去所做的事情。为了保持相关性，它必须继续依赖于人们单独能做什么。

如果法学硕士继续抓取人类创建的内容的能力明显下降，他们将无法添加、更新、纠正和扩充他们的数据集。它们的效用的消亡可能会很缓慢，但或多或少是有保证的。

放开我的 PII！

除了出版商、作者和其他创作者强烈要求 genAI 远离他们的内容之外，它在不久的将来还面临着另一个非常现实的问题。需要以某种方式保证，在从网络上抓取数百万千兆字节的数据的过程中，他们不会无意中获取个人识别信息 (PII) 或受现有法规保护的其他类型的数据。

FTC 因消费者保护问题对 OpenAI 展开调查。
正如广泛报道的那样，意大利因处理个人数据以及缺乏年龄验证控制而简单地禁止了 OpenAI 和 ChatGPT。在满足意大利的要求后，运营得以恢复。
欧洲的挑战远未结束。在波兰提交的一项全面投诉称 OpenAI“系统性违反”了 GDPR。

可以说，欧洲法院往往更关心公民的权利，而不是大型科技公司的利润。

我们甚至没有提到信任和安全。我最近与 Gartner 人工智能技术成熟度曲线专家 Afraz Jaffri 的谈话中谈到了这些担忧，他说：

第一个问题实际上是信任方面。无论外部法规如何，仍然有一个基本感觉，即很难控制模型的输出并保证输出实际上是正确的。这是一个很大的障碍。

genAI 的未来会怎样？ Gartner 技术成熟度曲线

这一切会触发关闭开关吗？

很容易说 genAI 将继续存在。很多人都说过了。事实上，一项重大的（即使不是完全新颖的）技术发展不太可能被遗忘或放弃。至少，组织将继续在自己的数据集或谨慎确定的外部数据集上使用这些功能，这将满足许多重要的用例。

尽管如此，由于监管障碍、法律挑战、信任问题以及其他尚未见过的障碍的组合，genAI 受到干扰、限制和极大改变的可能性远高于零。

唐纳德·戴维森，“图灵测试”， Mind 59 (1950) ↩︎

将 MarTech 添加到您的 Google 新闻源。