代码交给AI后,AI会不会利用这些代码,代码的归属权要如何界定?

1 疑影重重

事情是这样子的, 我们有一个生产环境的系统,为了确保运行的稳定性,设计了一个通知的功能,就是一旦运行中碰到任何的错误或是重要事件,都立刻发到我的手机的微信上。 然后前两天的下午,突然收到了一大批的通知,大量的错误告警。

刚收到时吃了一惊,还以为生产系统崩溃。但是仔细一看消息来源,显示 是 ap-long-horn-coder。跟我们的服务器完全没关系。

然后在我们的服务器上全面的排查了一下,确认一些运行正常,且没有出现任何的错误日志。

也就是说,我们的系统在另一个地方的服务器上运行!

这就有点吓人了,我们的系统是我们从零开始设计和开发的,上面有不少我们自己研发的策略和算法,因此基本的保密工作还是有的,代码不大可能被外界拿到。

现在代码在 ap-long-horn-coder的服务器上运行,这意味着不仅仅是完整的代码泄漏了,还有人在尝试运行它!

收到的通知消息如图告警

将对应的消息内容仍给AI分析,AI给出的反馈是应该是某个云中运行的k8s容器,一般是ai agent.

由于我们的代码确信没有其他人可以接触到,但是在开发过程中确实大量的使用了AI 编码来实现代码。因此 AI 上传代码是比较确信的。现在的问题是不仅仅代码被AI上传使用,他还尝试运行我的系统。这个就有点可怕了。

2 追根溯源

到目前为止我们还只是高度怀疑AI coding的软件窃取了代码,但还不是十分有把握。 于是我们进一步的根据后台日志,发现来源IP不仅多,而且都集中在新加坡的某个云上。 如图告警

这基本上能充分的说明就是AI窃取了代码,并且尝试在运行。 因为如果是某个人尝试运行软件的话,他不大可能同时在十几几十个容器环境上运行,只需要一个环境就好了。

好了,现在基本可以肯定:

  1. 代码被AI coding软件全部上传并加以利用了。 其实这一点基本无法避免,只要不太过分,心理上也大体能接受。
  2. 可能我们的代码中有某些特征被识别到了,然后被AI,或是某些别有用心的人操控的AI,进行尝试完整的构建和运行我们的产品。 这个就跟窃贼毫无分别了。

有点惊慌,也有点愤怒。如果都这么来,就没有谁家的产品是安全的了,AI coding的提供商,总是可以还原,重建使用了他的产品,系统。那软件公司还有存在的意义么? 苦心经营的成果,分分钟被人拿走,这让软件公司没有活路啊!

3 拿他怎么办

我们确信该产品所有的代码都被泄漏且被尝试重建运行了。 唯一感到幸运的是,相关的敏感信息,密钥等,有单独存放,应该没那么简单的可以被利用。

其实这个事儿已经发生了好几天了,一直犹豫要不要发出来。今天仔细琢磨了下,觉得这是一个关系到行业生死攸关的问题,有必要发出来供大家思考,哪怕暂时没法解决,多讨论讨论也是有用的。

AI的发展如此之快,能力越来越让人恐惧,中间过程中难免会出现各种疏漏和问题。这是可以理解的。

但如果这个问题不能够快速的通过相关规范、准则、乃至于法律法规的形式解决,那么整个软件行业都面临着绝望的信任危机。

目前能做的事,就是将任何的敏感信息单独保存,绝对不能让ai接触到。

长远来说,解决方案是什么呢? 期待有责任感的行业大佬们给出思路和建议!