昨天,AI圈上演了第一场“大人物的爽文”:
一位年轻而著名的编程天才在编程领域成立了一支只有10人的奥运“梦之队”,并在全球科技风暴的中心创办了一家公司。成立不到两个月,其第一款产品在正式推出前就风靡全球,并获得了硅谷风险投资人数千万美元的投资。photoshop最新版手机版功能介绍
雅兰仕m3
故事的主角是美国人工智能初创公司Cognition AI及其首席执行官Scott Wu。
3月13日,Cognition AI在x平台上发布了全球首位AI软件工程师Devin。
Devin是一个自主智能体,掌握全栈技能,独立学习不熟悉的技术,端到端构建和部署应用程序,自己纠正bug,甚至训练和微调自己的AI模型。
Cognition AI刚刚在社交媒体上发布了一个演示,引起了全球码农的关注。因为Devin真正颠覆了人们对开发工具的认知。
其中,最令人惊叹的能力是用户只需在Devin界面输入一条指令,即可端到端处理整个开发项目。
在SWE-bench基准测试中,它可以在没有人类帮助的情况下解决13.86%的问题。相比之下,GPT-4只能处理1.74%的问题,并且所有这些问题都需要人工提示来告诉处理哪些文件。
据报道,Devin已经成功通过了一家AI公司的面试,并在Upwork上完成了实际工作。一位网友在与Devin“战斗”了27分钟后评论道:“AI智能体的时代开始了。”
Devin的出现让许多程序员在深深的兴奋和恐慌中开始好奇:是谁创造了Devin?它真的能取代程序员吗?
首先是编程领域的奥运“梦之队”
Devin背后的公司Cognition AI非常神秘。据彭博新闻报道,该公司两个月前才正式成立。就连X上的官方账号也是今年1月注册使用的。
Cognition AI的长期目标是通过解决推理问题在广泛的学科领域中解锁新的可能性,而“代码只是一个开始”。该公司致力于推动人工智能技术的发展,并通过其产品改变人类与软件的交互方式。
据《甲子光年》报道,Cognition AI的核心创始团队由三人组成,分别是Scott Wu、Steven Hao和Walden Yan。从三人的名字不难看出,他们都是中国人。游起名字
正如他们的公司一般都很低调一样,三位创始人的简历也非常神秘,并没有被披露太多。“甲子光年”只在网上找到了一点资料。
CognitionAI的首席执行官Scott Wu只有27岁。他的亲兄弟吴子云也在这家公司工作。从中学开始,Scott Wu就展示了他在数学方面的天赋,并开始参加数学竞赛。
后来,在哥哥吴子云的影响下,Scott Wu迷上了竞技编程。两人都成为了竞技编程领域的传奇。两兄弟从十几岁开始就在国际编程比赛中“常胜将军”。
在2014年举行的IOI(国际信息学奥林匹克竞赛)中,Scott Wu以满分成绩获得第一名。
从小显露出的编程天赋不仅让Scott Wu在学习和比赛中取得了傲人的成绩,还让他在商业上领先于同龄人。
事实上,Cognition AI并不是斯科特·吴联合创立的第一家公司。最近,有人在社交媒体上发布了斯科特·吴四年前写的博客。根据博客中的描述,斯科特·吴四年前是午餐俱乐部的联合创始人兼首席技术官。
在最后一次创业中,斯科特表现出了非凡的技术能力和商业头脑。Lunchclub是一家专注于人工智能和机器学习内容的美国社交平台。它已获得1600万澳元的种子轮融资,用于连接线下专业人士。2020年,Lunchclub在由Coatue和Lightspeed Venture Partners领投的A轮融资中筹集了2400万美元,估值超过1亿美元。
CognitionAI的首席技术官是Steven Hao。Steven毕业于麻省理工学院,曾任Scale AI高级工程师,专注于AI系统研发。在Scale AI之前,Steven曾在简街、DE Shaw和Quora工作。
和Scott Wu一样,Steven Hao也是IOI的金牌得主,并在Codeforces和ACM-ICPC等编程竞赛中获得了最高荣誉。他的个人项目包括Down For A Cross,一个合作填字游戏网站,以及该系列的网络实现。
Walden Yan是CognitionAI的首席产品官。据悉,为了建立Cognition AI,Walden Yan不惜背着父母从哈佛退学。对此,沃尔登本人回应道:“离开学校开始认知是我做过的最简单的决定。”
作为一家刚刚成立不到三个月的创业公司,Cognition AI甚至没有固定的办公地点。该团队在硅谷的Airbnb和纽约的家庭办公室只有10名员工。
但就是这样一个连办公室都没有的10人小团队,却造就了Devin这样一个令世界为之惊叹的AI开发者,可见这个小团队的实力。除了三位核心创始成员外,团队其他成员曾在Cursor、Scale AI、Lunchclub、Modal、Google DeepMind、Waymo和Nuro等多家知名公司工作过。
值得一提的是,这支10人团队平均每人获得了10枚IOI金牌,这显示了他们在编程和技术方面的能力。
Scott Wu表示,这样的团队背景是Cognition AI的优势。
Scott Wu说:“教人工智能成为程序员是一个非常深入的算法问题,这需要系统做出复杂的决策,并期待接下来的几步决定选择哪条路线。“这几乎就像我们在脑海中玩了很多年的游戏,现在我们有机会将其编码到人工智能系统中。”
目前,Scott Wu还没有向媒体透露Devin的太多技术细节,只是说该团队找到了一种将LLM与强化学习相结合的独特方法。“这在很大程度上取决于模型和方法,以及如何使事情恰到好处。”
第二,彼得·蒂勒支持认知AI。
就是这样一个没有固定办公室的精干团队,却个个都是技术大神,引起了美国顶级大佬的注意。
根据公开信息,CognitionAI已经获得了彼得·蒂勒的创始人基金2100万美元的A轮融资。此外,据一名彭博记者报道,Twitter前高管Elad Gil也参与了对认知人工智能的投资。
放眼美国乃至全世界的风险投资市场,彼得·蒂勒是绝对的传奇人物。他曾经是国际知名支付工具PayPal的创始人,现在是美国硅谷的著名投资人。他以其恶毒的投资眼光而闻名,被硅谷誉为“老大哥背后的老大哥”。
投资圈的一句经典名言——“竞争是留给失败者的。如果你想创造和获得持久的价值,那么就建立一个垄断企业。”这是彼得·蒂尔亲口说的。
在转型为专业投资者之前,彼得·蒂勒曾经是一位传奇企业家。
2002年,彼得·蒂尔以15亿美元的价格将他的PayPal卖给了易贝,获得了5500万美元的净利润。此后,PayPal的核心员工纷纷离职创业,造就了今天硅谷的一大批企业领袖,这些人也因此被称为硅谷的“PayPal黑帮”。
其中,第二个人埃隆·马斯克后来创立了特斯拉和太空探索技术公司;,一家美国勘探技术公司。前执行副总裁雷德·霍夫曼创建了职场社交媒体LinkedIn联合创始人麦克斯·拉夫琴创建了社交游戏公司Slide,后来以1.82亿美元的价格卖给了谷歌。杰里米·斯托佩尔曼创立了Yelp,美国最大的评论网站;技术人员查德·赫利和陈士骏共同创建了YouTube。
PayPal团伙成员创办的公司中有7家市值超过10亿美元。
离开PayPal后,彼得·蒂勒于2005年投资5000万美元成立了Founders Fund风险投资公司,专门投资具有最先进技术的尖端技术项目,包括航空空航天、人工智能、先进计算、能源、健康和消费互联网。
据说彼得·蒂勒将投资公司命名为创始人基金,因为他认为创业公司的成败取决于其创始人。因此,他干脆将公司命名为创始人基金,对于每个投资项目,他也坚持“协助和不干涉”的原则,让创始人掌握自己的命运。
不难发现,彼得·蒂勒的处事风格相当独特。这种个性甚至体现在公司的选址上。作为一家科技投资公司,Founders Fund没有选择硅谷的沙丘路(Dune Road),那里聚集了大多数科技风险投资家。相反,它在沙丘路以北35英里的金门大桥旁开设了这家公司。
当然,在投资方面,彼得·蒂勒也“反常规”。2011年,创始人基金公开欢迎异想天开的想法,同时嘲笑Twitter(现在是“X”)的投资者:“我们想要会飞的汽车,而不是140个角色。”
正是创始人对改变技术和技术改变世界的偏执追求,使得创始人基金在早期投资了许多明星项目,其中脸书、Spotify、Palantir、太空探索技术公司、Airbnb、来福车和Wish都是各自领域的巨头公司,为创始人基金带来了可观的回报。
在人工智能领域,彼得·蒂勒的投资眼光更加险恶。
虽然创始人基金在人工智能领域投资的项目并不多,但每一个项目在人工智能领域都有着不可撼动的地位。
例如,AlphaGo于8年前推出,点燃了DeepMind,全球掀起深度学习浪潮;ChatGPT于2022年底推出,引爆了当前的大型号浪潮,OpenAI;以及规模AI,将数据标注行业从“劳动密集型”转变为“技术密集型”。
这些现在正在撰写全球人工智能技术发展的顶级公司背后都有Founders Fund的名字。
彼得·蒂勒特别喜欢技术偏执狂——比如马斯克、扎克伯格、哈萨比斯和奥特曼。Cognition AI首席执行官Scott Wu也不例外。
因此,不难判断,创始人基金认可的认知AI未来发展将不可限量。
Peter teale还高度评价了对认知AI的最新投资,认为这家公司将成为人工智能领域的下一家超级公司,未来它将与OpenAI、DeepMind和Scale AI齐名。
第三,还有3到5年更换程序员?
由硅谷的顶级投资者投资,Devin两个月前刚刚成立了一家公司,并制造了世界上第一个AI程序员。虽然还没有正式推出,但已经引起了全球科技圈的关注。
斯科特·吴和他的10人小团队的经历令人耳目一新。
连贯而稳定的推理能力是Devin最令人兴奋和恐惧的地方。
Devin似乎确实在许多方面远远领先于其他编码助手。用户只需要向Devin发送指令,它就可以自动启动并完成这些任务。当Devin工作时,它会告诉用户它的工作计划并显示它正在使用的命令和代码。
在Devin完成任务的过程中,用户可以提示他解决相应的问题,它会中途整合反馈。目前,大多数人工智能系统很难在类似的长期工作中保持一致性并专注于任务,但Devin可以在不偏离轨道的情况下完成数百甚至数千项任务。
计算机科学家塞拉斯·阿尔贝提也尝试了Devin,并表示这项技术是一次飞跃。根据他的描述,这不像是一个写代码的助理,而更像是一个真正的工人在做自己的事情。
阿尔贝蒂说:“这感觉非常不同,因为这是一个可以为你做事的自主系统。Devin擅长项目原型设计,修复错误并以图形形式显示复杂数据。“其他助理在四五步后出轨,但Devin几乎毫不费力地完成了整个工作流程。”
《甲子光年》就Devin的诞生采访了多位国内技术从业者。一些国内从业者认为,应该理性对待戴文,尽管看起来戴文“遥遥领先”。
知止AI wisemodel创始人兼首席执行官、清华大学校友会AI大数据委员会副秘书长刘道全表示:“此前在wisemodel社区中讨论过代码是大模型最明确的应用方向之一,因此Devin的出现并不意外,只是时间问题。”
“很多AI产品在出来之前都被吹得很厉害,但上线之后就有那种感觉了。现在Devin的演示视频似乎解决了许多事情,但其真正的大规模应用有限。一是使用成本高;其次,目前程序员的极限就是AI的极限。AI写的代码程序员看不懂,也没有意义。”一家AI创业公司的工程总监告诉“甲子光年”。
从实际应用来看,一家云测试/AI数据标注公司的CTO坦言:“在企业中,真正写代码的时间可能只占20%,大部分时间是了解和沟通客户需求、设计方案和核对信息。因此,像Devin这样的AI程序员取代人类开发人员的主要工作可能需要3-5年的时间。”
对此,刘道全也表达了类似的观点:“Devin在完成非常明确的任务方面具有优势,但谁来分配任务以及在整体系统开发过程中,具体的开发任务往往不是最困难的,但如何构建系统的整体架构以形成完整的系统则更为关键。”
然而,在Cognition AI的介绍中,用AI写代码只是一个开始,“推理”才是Cognition AI真正的野心。
或许认知AI在推理方面的后续成果更值得期待。
未经允许不得转载:科技让生活更美好 » AI程序员Devin:通过了面试,但不一定适合职场