高盛认为追踪人工智能的使用没有抓住要点

//

李 雪梅

当美国企业竞相衡量员工如何使用人工智能时,高盛却走了一条不同的道路。

许多公司已经开始追踪个人。在摩根大通,该公司监控显示数以万计用户的人工智能相关活动的仪表板,让员工将自己与同事进行比较。据《商业内幕》上个月报道,社交媒体巨头 Meta 正在美国员工的电脑上安装软件来跟踪击键和鼠标移动,以训练其人工智能。

在高盛,首席信息官 Marco Argenti 专注于评估团队使用人工智能工具的速度,而不是专注于个人用户的指标,他认为这可能会导致“只见树木,不见森林”。

Argenti 负责管理大约 12,000 名工程师,随着人工智能重塑开发人员创建软件的方式,他正在带领公司实现快速转变。他关注的是高盛工程师从创意到生产的速度有多快,以及他们的产出是否真正改善了从创新创意到准备推出的产品所需的时间。

虽然高盛可以访问个人使用工具(包括其人工智能产品)的数据,但该公司更专注于采取跨团队视角来加快项目进度、执行质量控制评估并跟踪预算中人工智能代币的消耗。该银行尚未建立跟踪仪表板来强制开发人员使用人工智能来主动将他们的采用率与同事进行比较。

我与 Argenti 坐下来讨论了高盛如何定义人工智能时代开发者的成功,以及为什么他说对开发者活动进行单独监控可能没有抓住要点。

这是我们的对话,为长度和清晰度进行了编辑。

关于是否进行跟踪存在争议。作为管理者,你的看法是什么?在促进人工智能的采用方面,是否有一条道路比另一条道路更有效?

鉴于工作通常是由团队完成的——现在的团队是混合代理和人类——我们倾向于关注团队指标。大多数情况下,这是他们开发功能的速度。

我们关注的是流程——从想法到生产需要多长时间。你知道这一点是因为你看到一个团队有一定的积压工作,突然间它开始烧掉积压工作。

告诉我为什么你说从团队层面而不是个人层面来看待事情更有效。

如果只看个人,真是只见树木不见森林。这就像只看场上的一名球员一样。

好吧,这位球员的动作更多了,但为什么我没有进更多的球?嗯,因为他们需要传球。

分析人工智能如何提高工程师的工作效率的正确方法是什么?

如您所知,衡量开发人员的生产力一直是公司一直追求的目标。而且不存在单一的神奇指标,因为有些公司会问“有多少行代码?”但这并不是一个很好的方法。归根结底,构成有用输出的不一定是代码行数。

假设您参加了健身训练计划。查看某些生命体征的变化可能比孤立地查看数字更有效。如果您开始看到您的胆固醇下降,或者您的血糖水平相对于您原来的水平有所提高,那么也许这表明您正走在正确的道路上。

大家关心的另一个大话题是代币成本的飙升。您如何衡量您的支出是否创造了明显的成果?

如果您有大量的令牌使用并且输出没有变化,那么此时,这可能意味着您仍处于实验阶段。我们确定了一个阈值——低于该阈值,产出指标没有变化,但一旦超过该阈值,生产力就开始变化。

经过调查,这表明人们在规划本身上与人工智能反复讨论——在开始编码之前使用代币创建实施计划和业务需求文档。该准备工作不会立即产生编码输出,因为它发生在开发人员开始编写代码之前。

因此,您会看到令牌使用的加速,但输出没有立即变化。创建计划后,代理开始构建代码,然后您会看到令牌消耗的进一步增加和编码输出形式的结果。

您的工程师对人工智能在加快完成任务速度方面的效用有何看法?

我们已经过了一个临界点,兴奋取代了恐惧。

事实上,我刚刚参加了一次展示会——我们举办的一种创新类型的会议。主导情绪实际上是一种赋权感。人们感到几乎解放了。当然,几周或几个月前,确实存在一些怀疑和恐惧,但我将其与那些没有真正使用它的人联系起来。

这种速度如何改变他们向你展示作品的方式?您是否看到了从“PowerPoint 文化”转向更注重实践的文化的转变?

他们带来了一个已经解决的非常具体的问题。他们几乎立即开始研究新产品的原型——有时甚至是在想法完全正式化之前。今天,您几乎可以进行实时原型设计。即使在会议期间,您与他们交谈,他们也可以在您眼前进行更改。

在过去,他们会带着 PowerPoint 或六页纸进来,我不得不想象。今天,我看到了一个实际的产品。我可以直接说:“这个怎么样?”在会议中,他们可以做出改变。想法和原型之间的时间为零。你是一种“3D打印”软件。