点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:首位“AI软件工程师”亮相引爆科技圈
首页> 科技频道> 综合新闻 > 正文

首位“AI软件工程师”亮相引爆科技圈

来源:科技日报2024-03-15 09:29

  ◎记者 张梦然

  一家成立不到两个月但拥有十名天才工程师的初创公司Cognition,搞了一个引爆科技圈的大动作。

  他们推出了一款名为Devin的人工智能(AI)助手,可以协助人类软件工程师完成诸多开发任务。Devin不同于现有其他AI编码者,它可以从零构建网站、自行部署应用、修复漏洞、学习新技术等,人类只需扮演一个下指令和监督的角色。

  这是第一个真正意义上完全自主的AI软件工程师,一亮相即掀起轩然大波,因为人们担心:人类程序员是不是真要失业了?

  测试表现超越“同辈”

  据Cognition官网报道,Devin只需一句指令,即可端到端地处理整个开发项目。

  按照用户需求,Devin可以同时执行多步骤工作流程,人类工程师则可以实时观察其进度,发现错误时,跳出指令进行修正。这便于工程师们将大部分工作“外包”给AI,自己则可以潜心于创意性工作。

  在SWE-bench基准测试中,Devin的表现远超Claude 2、Llama、GPT-4等选手,能够完整正确地处理13.86%的问题。相较之下,GPT-4只能处理1.74%的问题。更重要的是,Devin在测试中没有得到任何帮助,而其他所有模型都需要帮助,即人们要准确告知模型需要编辑哪些文件。

  这一进展,标志着AI在自主理解和解决软件开发问题方面取得了显著进步。目前,Devin已经成功通过一家AI公司面试,并且在Upwork上完成了实际工作。

  运作几乎完全自主

  Devin的厉害之处,还在于可以规划和执行异常复杂的工程任务,这类任务通常需要数千个决策才能完成。在这之中,无论进行到任何一步,它都可以回调所有相关的上下文信息,保证任务的逻辑性,也便于随时校正。

  更让人震撼的是,Devin不仅能帮人们解决代码,还囊括了与之相关的整个工作流。

  譬如,当工程师需要设计一个网页游戏时,Devin首先能生成网页,接着还能完成服务端的部署,最后直接发布上线,省去了中间大量人工操作。甚至在发现漏洞之后,Devin还会回溯报错出现的位置及对应的数据,然后分析原因并给出解决方案。

  此外,作为一个AI全能助手,Devin还可以帮助人类训练和微调其他AI。对于一些常见的模型,你只需要提及模型的名称,Devin自己就知道要怎样去训练。

  那人们需要做什么呢?按设想,最终的Devin会让人类只需要发号施令,其他什么也不用做。

  对软件开发业影响深远

  初创公司Cognition虽然只有十名员工,但他们手中却握着十块IOI(国际信息学奥林匹克竞赛)金牌,核心创始团队为3名华人。

  Devin现处于内测阶段,有意用户可申请提前试用。目前,团队尚未透露更多核心技术细节,但他们表示,Devin源于其长期推理及规划研究的进展。编码只是第一步,这一AI助手其实可推广到更宽领域。

  Devin的出现,可能对软件开发行业产生深远影响,甚至可能减少对人类开发者的需求。但须注意到,该技术仍处于早期阶段,其成熟度和效果需要业界作进一步评估。

  就目前而言,Devin的成功可以说为当今软件开发人员带来更新更好的AI协作体验。人们从繁琐工作中“解放”,只需监督AI系统去处理,而自己将精力投入到创新性任务上,实现生产力的真正提高。

[ 责编:武玥彤 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 走出家门 感受年味

  • 冬奥会|单板滑雪——男子坡面障碍技巧决赛:苏翊鸣夺冠

独家策划

推荐阅读
莱州中华武校第十次登上央视春晚舞台
2026-02-17 10:21
近日,一个名为Moltbook的社交平台突然走红。与普通网络平台不同的是,Moltbook上的用户都是AI智能体。
2026-02-14 09:21
全球规模最大的200万吨/年柴油吸附分离装置目前在中国石油广西石化稳定运行。
2026-02-14 09:16
大连理工大学赵珺教授带领师生团队正抓紧时间,为实现可重复使用运载火箭关键部件的“复用检测”技术突破全力冲刺。
2026-02-14 09:12
一场刷新人类对宇宙极端物理过程认知的高能事件,被中国科学卫星清晰捕获并成功解读。
2026-02-14 09:11
近日,中国计量科学研究院研制的锶原子光晶格钟NIM-Sr1正式获准校准国际标准时间,实现了我国光钟参与校准国际标准时间“零”的突破。
2026-02-14 09:10
装上智能仿生手,截肢患者可以轻松拿起水杯喝水;高位截瘫患者用意念移动电脑光标,操控轮椅,指挥机器狗取外卖……
2026-02-13 09:50
凌晨2时,南昌西动车组运用一所检修库内灯光如昼。“接触网已断电,安全措施准备完毕,申请登顶!”确认许可后,国铁南昌局电务段南昌西车载设备车间工长曹准与工友一前一后登上动车组车顶,对北斗天线进行全面“体检”。
2026-02-13 09:45
近日,广西涠洲岛海域发生渔船撞击布氏鲸事件,鲸鱼受伤的画面令人揪心。虽然撞鲸的并非观鲸船,但这起事件也给正处于旺季的观鲸游敲响警钟——负责任地观鲸,有边界地亲近,人与自然和谐共生图景才能真正长久。
2026-02-13 09:43
核光钟通过真空紫外激光诱导原子核跃迁,具备更高精度与强抗干扰能力,且可实现便携化应用。但研制核光钟的道路上的一个核心瓶颈,是无法研制出能激发核跃迁的连续波激光光源。
2026-02-13 09:42
2021年,王勤团队开始研发低成本、适用于牧场环境的马匹体形自动测定设备。王勤团队搜集了全球90个马群体、近40个品种的基因组信息,构建了包含2000多个个体的参考面板——这是目前全球规模最大的马基因组参考数据库。
2026-02-13 09:36
一纸锦旗山水间,杏林春暖绿意长。
2026-02-12 11:01
金星与地球大小相近,同样诞生于太阳系内侧,却有着截然不同的命运。
2026-02-12 09:41
科技部十司相关负责同志解读《调查处理规定》。
2026-02-12 09:38
《细胞》封面:猕猴屏状核细胞分类与全脑联接图谱。在当前脑图谱大科学计划研究目标迈进绘制非人灵长类介观脑图谱的关键阶段,中国科学家仍在进一步集聚全球力量,持续扩大“朋友圈”。
2026-02-12 09:25
据悉,在战略上,植物星球计划还将整体提升全球生物多样性保护和实现碳中和的生态能力,构建植物科学领域全球大科学命题国际合作的新格局。
2026-02-12 09:17
马年将至,作为一种兼具力量与速度的动物,马正受到格外的关注。
2026-02-12 09:12
工业和信息化部等五部门近日印发《关于加强信息通信业能力建设支撑低空基础设施发展的实施意见》。加强监管能力体系建设,规划无人机专用号段,推动“一机一码一号”能力建设,探索标识解析在无人机领域的应用,形成无人机通信资源精细化管理。
2026-02-11 09:25
全球森林逐渐被快生树木主导,而稳定生态系统的慢生树种正在消失。“我们关注的是极为独特的物种,它们主要集中在生物多样性丰富、生态系统联系紧密的热带和亚热带地区。“此外,在现在和未来受到干扰的地区,非本地物种可能会加剧对光、水和养分的竞争,从而使本地树木更难生存。
2026-02-11 09:32
中国科学院动物研究所研究员王红梅带领的“灵长类胚胎发育的规律解析与体外模拟团队”,用27年的接力攻坚,把灵长类早期胚胎发育这个看不见、摸不着的“黑匣子”,变成了清晰可见的“生命剧本”。
2026-02-11 09:32
加载更多