ChatGPT失业危机!微软Copilot重磅升级,图文代码能力暴涨,还免费

作者|香草

编辑|李水清

智慧12月6日报道,今天上午,在旗下AI助手Copilot发布一周年之际,微软宣布Copilot有三大更新,包括新模型、新搜索和代码解释器,图形能力和代码能力大幅升级。简单来说就是ChatGPT Plus能做到的。升级后,Copilot几乎什么都能做,而且还是免费的。

在此次更新中,Copilot不仅将很快支持OpenAI的最新GPT-4 Turbo型号,还将全面升级文圣地图型号DALL-E 3 ,从而提供更高质量和更精确的图像。

在搜索方面,Copilot推出了两项新功能,从多模态和意图理解方面对搜索引擎进行了增强。简单版代码解释器现已上市,可以用自然语言生成代码,并支持在沙盒环境中运行,未来还将支持上传和下载文件。

AI邮件自动化工具Answera的创始人Paul Couvert在社交平台x上分享了Copilot和ChatGPT Plus升级后的功能对比,从图中可以看出,Copilot几乎提供了ChatGPT Plus的所有功能,在生成图片的数量和网页搜索的速度方面甚至更好。

至关重要的是,Copilot仍然是免费的,这使得每月20美元(约合人民币143元)的ChatGPT Plus在性价比上有些欠缺。

▲Copilot与ChatGPT Plus的功能对比(图片来源:X@itsPaulAi)

1。访问最新的OpenAI型号GPT-4 Turbo,并升级DALL-E 3

型号方面,Copilot即将接入OpenAI的最新型号GPT-4 Turbo,这意味着Copilot将升级到128k上下文窗口。微软表示,该型号目前正在小范围测试,将在未来几周内广泛集成到Copilot中。

Copilot还将提供升级的DALL-E 3模型,该模型将生成更高、更准确的图像。

下图是DALL-E 3升级前后生成的图像对比,提示是:一只逼真的剑龙正在美甲店修剪它的骨板。

▲DALL-E 3升级前后的图片对比(图片来源:微软)

可以看到,升级后的DALL-E 3对剑龙的皮肤纹理和皱纹刻画得更加细致逼真,背景中的建筑物也更加立体,整个画面的光影层次也有所提升。

下面的图片是另一组例子,来自微软微广告和网络服务部门的首席执行官米哈伊尔·帕拉欣(Mikhail Parakhin),并附有提示:从高处看,鲸鲨晚上在静水中的皮划艇下游泳。细节丰富。

▲DALL-E 3升级前后的图片对比(图片来源:微软)

升级后的DALL-E 3赋予了图像更多细节,描绘了水下场景,还通过光影表现了皮艇和鲸鲨的距离感。相比之下,左边的图有点太平了。

二、AI搜索推出两大更新,深度搜索效率提升10倍

在搜索功能方面,Copilot这次推出了两项更新。

第一个是多模态搜索基础。微软基于自主研发的AI模型Prometheus,结合了GPT-4V的视觉能力、Bing图像搜索和网络搜索数据,提供了更好的图像理解体验。

▲普罗米修斯多模态工作原理(图片来源:微软)

在微软提供的例子中,用户上传了一个火箭发射的图像,并询问了发射时间。

Copilot首先分析图像,提示“出于隐私保护,图片中的人脸将被隐藏”。在识别了图片中的信息后,副驾驶开始搜索“月船3号的发射时间”。

最后,副驾驶生成了一个答案:“根据你提供的信息,这张图片中的火箭来自月船3号任务。它于2023年7月14日由India空Inter-Research Organization(ISRO)从Satish Davan航天中心发射升空。”

▲多模态搜索功能预览(图片来源:微软)

微软表示,传统的多模态系统可以笼统地描述图表中的内容,但结合在线搜索,Copilot可以在识别图像信息的基础上提供更多的问题答案。目前已经推出该功能。

第二个新功能是深度搜索

微软方面表示,推出这一功能的主要原因是,当遇到一些复杂、详细或具体的问题时,当前的搜索引擎有时无法理解用户的期望。

深度搜索基于Bing现有的网络索引和排名系统,并基于GPT-4进行了增强,将搜索查询扩展为更全面的描述,包括了一个理想结果集应该包含的内容。

遇到一些模棱两可或者模棱两可的查询,比如“积分制在日本是怎么运作的”,这里的积分可能有很多含义。深度搜索将使用GPT-4找到所有可能的意图,并提供一个消歧窗格,用户可以从中选择自己的描述。

▲深度搜索回应歧义查询(来源:微软)

微软表示,深度搜索使用各种信号来确定每个结果的相关性和质量,并考虑主题匹配程度、详细程度、来源的可信度、新鲜度和受欢迎程度等因素。它的搜索效率是普通搜索的10倍,但速度可能需要30秒才能完成。华硕破晓

这项功能仍在测试和改进中,微软将在全球范围内随机选择用户进行试用。

第三,引入了代码解释器,Edge可以一键汇总视频内容

Copilot还推出了代码解释器,支持更精确的计算、编码、数据分析、可视化、数学等任务。

据介绍,Copilot code interpreter将编写代码来回答用户的自然语言请求,并支持在沙盒环境中运行代码。同时预装了很多流行的数据科学工具和库,包括Pandas、NumPy、Matplotlib等。

用户还可以向Copilot上传和下载文件,并将自己的数据和代码与网络搜索结果相结合。

目前代码解释器已经发布了简单版,暂时还不支持上传文件或者复杂的代码功能。预计新版本将在几周内逐步升级。果壳产品好用吗

▲Copilot代码解释器(来源:微软)

在Edge浏览器中,Copilot侧边栏即将推出 inline composition功能,带有重写菜单,可以一键将生成的文字填入网页输入框,也可以选择想要更改的文字,让Copilot重写。同时引入视频理解和问答功能。通过侧边栏,用户可以总结或询问当前观看的视频。该功能现已开放。

广州品牌营销

▲在Edge中使用Copilot总结视频内容(图片来源:微软)

此外,根据微软CVP和Bing的工程和产品总监乔迪·里巴斯(Jordi Ribas)的说法,还有一个“令人兴奋的新功能”:笔记本界面。界面的入口位于搜索和对话旁边,用户可以专注于提示创建、提炼和迭代输出。它具有记忆功能,并且还接受长度为18k字符的长文本提示。

该功能目前正在小范围测试,尚未全面上线。

▲副驾驶的笔记本功能界面(图片来源:微软)

结论:微软Copilot重新进化,留给谷歌的时间不多了?

上周ChatGPT刚刚庆祝了一周年,现在Copilot也迎来了“一岁生日”。从这次发布的更新中可以看出,Copilot的功能越来越强大,几乎可以媲美月费20美元的ChatGPT Plus。

在之前的OpenAI“政变”事件中,微软一边“支持”它,一边争取董事会席位。虽然最后微软只拿到了一个无投票权的观察席位,但也赢得了一定的控制权。目前,两者仍然保持着紧密的合作联盟。

另一方面,虽然微软的长期竞争对手谷歌在AI方面暂时落后,但也有消息称,大模型Gemini最快将于本周公开预览。作为谷歌十年来最大的人工智能项目,双子星座能否赶上GPT 4号还有待观察。

未经允许不得转载:科技让生活更美好 » ChatGPT失业危机!微软Copilot重磅升级,图文代码能力暴涨,还免费