协助行业轻松获取高性能基础模型,亚马逊云科技的目标是让生成式AI普惠化
生成式AI技术及其带来的AIGC行业热度居高不下,以往开发者只能使用基于大模型的生成式AI产品,如ChatGPT、等,而无法基于大模型以自身数据直接进行深度「定制」,并确保用户数据的安全性。据韩国媒体《》3月30日报道,三星内部便发生过三起涉及ChatGPT误用与滥用案例,包括两起「设备信息泄露」和一起「会议内容泄露」,其半导体设备测量资料、产品良率等内容或已被存入ChatGPT学习资料库中。
针对行业用户需求,亚马逊云科技推出了一项全新的全托管服务——Amazon Bedrock,用户可以通过API访问亚马逊云科技和第三方基础模型提供商的预训练基础模型。其目标是让生成式AI普惠化,而Bedrock则是客户使用基础模型构建和扩展生成式AI应用程序的最简单方法,降低了所有开发者的使用门槛。
以下为本次调研和「亚马逊云科技生成式AI媒体沟通会」的相关内容整理:
AIGC持续火爆,行业迫切需要可轻松获取的高性能基础模型
绮观商业:当前生成式 AI 技术发展处于怎样的阶段?生成式AI 技术应用处于怎样的市场阶段?
亚马逊云科技:我们正处在一个令人激动的机器学习被大规模采用的转折点上,我们也相信生成式AI将会重塑大量客户体验和应用程序。
基础模型拥有巨大的潜力,但我们仍处在初级阶段。在过去的数年间,我们都亲历了技术的快速发展,机器学习的演进也是日新月异。我们期待未来会涌现全新的体系和架构,而基础模型的多样化会推动新一波的创新浪潮。此前闻所未闻的新应用体验,在今天已经成为现实。
绮观商业:从亚马逊云科技的角度看,生成式AI 技术在哪些行业领域的应用渗透速度会比较快?
亚马逊云科技:针对中国客户的情况,我们有如下观察。首先,正如国内会经常用AIGC来定义这一波趋势,与内容生成有关的领域会首先受益,例如:
另外还有其它在利用生成式AI重塑底层实现方式的领域,例如:
在软件行业,比如协同类的办公软件的效率提升,其中编程软件也是一大应用领域:比如本次发布的 能够为程序员基于原有使用习惯的编程开发环境生成代码,大幅提升开发效率,实现安全隐患扫描。
绮观商业:在这样的环境下,围绕生成式AI 技术的应用开发者或技术集成商,有着怎样的市场机会,又面临着怎样的挑战?
亚马逊云科技:生成式AI的浪潮可能才刚刚开始,像Gartner也有类似的判断,认为整个行业才刚刚开始,很多技术还是处在非常早期的阶段。所以在选择合适的场景和技术时,需要首先要想清楚最需要解决的是什么问题,再此基础上制定一个最适合你业务方向的路线和计划。
我们最近在跟客户聊天的时候,每个客户都会谈到AIGC,有些相比来说会比较务实一些。AIGC对他们的业务长远来说一定会有非常大的帮助,但是短期之内,第一步怎么走亚马逊云无法访问,应该选择什么样的方向、选择什么样合适的目标去走,这个只有你自己能够回答,因为只有你最知道业务的痛点和需要解决的问题。所以制定一个最适合你自己业务方向的路线和计划是很重要的。接下来就是选择需要什么样的工具、什么样的云平台、什么样的大模型来帮助实现第一个目标。
许多客户告诉我们,他们希望以预训练的基础模型作为基础,利用它们构建自己的应用程序,无需收集大量训练数据和花费数百万美元进行模型训练。为了让生成式AI能够像我们相信的那样普及,需要降低客户使用门槛,但当前还缺少以下重要的东西:
亚马逊云科技的目标是让生成式AI普惠化
绮观商业:亚马逊云科技如何帮助客户应对这些挑战?
亚马逊云科技:我们推出了Amazon Bedrock,这是一项全新的全托管服务,是客户使用基础模型构建和扩展生成式AI应用程序的最简单方法,降低了所有开发者的使用门槛,其包括了四项创新:
我们认为各行各业、各种类型和规模的客户都将从Bedrock和Titan基础模型中受益。我们看到了内容生成、文本摘要和问答等实例的直接应用,但更高兴看到客户将这些技术应用于解决一系列复杂任务中。
绮观商业:对于应用开发者或集成商来说,Bedrock 的核心优势有哪些?
亚马逊云科技:首先,全托管的体验。Bedrock通过API提供无服务器的托管体验,客户无需担心实例类型、网络拓扑和端点等基础设施细节。
其次,轻松定制。客户只要在Amazon S3中提供少量(低至20个)带标签的示例,就可以轻松定制Bedrock的基础模型,用于其特定用例。
第三,以隐私思维构建。用于模型微调的客户专有数据不会用于训练基础模型,确保客户的工作成果不会让其它客户(包括竞争对手)受益。
第四,包含Amazon Titan基础模型。Bedrock可以独家访问亚马逊云科技开发的最先进基础模型。
最后,向客户提供选择权。客户可以在亚马逊云科技和第三方合作伙伴的多个不同基础模型之间进行选择,这些基础模型都可以进一步定制以支持其特定用例。
绮观商业:目前Titan模型是否已经正式上线?
亚马逊云科技:目前Bedrock服务、Titan模型、以及Bedrock里面可用的第三方模型,均处于邀请测试的状态。目前我们能披露客户包括一家海外的智能文档初创公司Coda,已经开始试用Bedrock,借助Bedrock去访问Titan模型。另外,飞利浦医疗影像系统也宣布他们会加入到Bedrock试用,进一步提升其AI能力。强调一下,Titan模型只有通过Bedrock这个渠道、这个服务才能可用到。
绮观商业:除了Titan等自有模型外,Bedrock其实还包含了三个外部模型。未来Bedrock会不会还接入其他模型?目前国内行业头部公司也在陆续发布自己的大模型,未来和Bedrock 会是怎样的竞合关系?
亚马逊云科技:目前Bedrock服务支持多种第三方合作伙伴的行业领先基础模型,同时独家提供亚马逊云科技行业领先的Titan基础模型。这为客户提供了更多选择,以寻找和定制最适合其特定用例的模型。
我们的目标是让生成式AI普惠化。如果公司有兴趣作为模型提供商与 Bedrock 合作,他们可以联系亚马逊云科技。但是,也请注意Bedrock不是一个开放的市场,我们目前只在Bedrock中支持选定的提供商。
您可以理解我们根据客户的需求帮客户挑选行业领先的模型。但是需要强调一点,它并不是一个开放的模型市场,我们不会将其规模无限扩大。
大模型本身只是其中一个环节,必须有能保证数据安全和业务安全的环境
绮观商业:刚才提到亚马逊云科技的定位不是大模型超市,而是会帮助用户去筛选那些优质的头部的模型。为什么会做这样的设定?
亚马逊云科技:云的目标是为了实现生成式AI的普惠化,我们做的所有事情,包括我们发布的所有这四项重要的功能,都是为了实现这一目标。
为什么要有自研芯片?因为自研的硬件是专门为训练和推理场景所设计的,结合我们自己的其他硬件,比如像Nitro安全加密芯片、网络增强型的功能,可以最大限度的为我们提供最高性价比的算力。
比如像Bedrock,能够帮助用户实现全托管的训练环境亚马逊云无法访问,让用户可以把精力放在自己要做的训练模型的工作上面,可以降低生成式AI的使用门槛。
再比如,这是具体的细分领域的解决方案,未来你会看到在整个行业场景方面有很多产品出现。
从亚马逊云科技本身来看,为了让用户实现生成式AI的普惠化,不仅只是底层算力的环境,开放式的、多元的基础的大模型( model),还有能够为用户提供安全的、保证用户隐私的训练环境,以及就像这样在细分领域的解决方案。这都是我们认为的在未来在生成式AI的服务方面,能够为用户做的工作。
绮观商业:目前是否已有应用案例,主要用于哪些行业领域?是否可以简单介绍一个典型案例?
亚马逊云科技:使用亚马逊云科技的机器学习(ML)和人工智能(AI)服务的客户已超过10万家,许多领先的生成式AI提供商,如AI21 Labs、 AI、Hugging Face和AlexaTM都在亚马逊云科技上运行。
比如欧特克,他们使用亚马逊云科技生成式AI能力来构建和训练人工智能驱动的设计工具,使他们的设计工程师可以摆脱各种设计的束缚并创建候选设计。他们使用算法来探索各种可能性。该系统提出了一种新的飞机隔板设计,比以前的设计轻 45%,并且更加坚固。这是一个使用生成式AI做应用的成功案例。
另外,Canva——一个在线设计工具,他们引入了一项功能,可以让用户输入文本提示并获得人工智能生成的图像。他们能够在很短的时间内完成这项工作,并在不到三周的时间内将其展示给他们的1 亿的用户。
还一个应用案例是 Runway ML,这家所做的是,使用亚马逊云科技上的模型帮助创建奥斯卡获奖影片《瞬息全宇宙》中的一些场景。他们的项目时间安排非常紧迫,其中有一个镜头,岩石在沙子中旋转移动。利用镜头来创造这种奇特的视觉效果,是需要很多时间的。而我们帮助他们将很多天的制作工作减少到几分钟。
绮观商业:在客户的模型训练或具体应用过程中,如何确保客户数据合规?
亚马逊云科技:在亚马逊云科技,客户信任是我们的最高优先级。亚马逊云科技会持续监测不断变化的隐私监管和立法环境,识别合规变化,确定我们的客户可能需要哪些工具来满足合规需求。维持客户信任是一项持续的承诺。我们会努力告知客户我们已经实施哪些隐私和数据安全策略、实践做法和技术手段。
在使用Amazon Bedrock时,客户的任何数据都不会用于训练底层模型。所有数据都经过加密,并且不会离开客户的虚拟私有云 (VPC),因此客户可以相信他们的数据是保持私密的、机密的。
我们一直在强调,如果用户要基于大模型进行自己的应用场景开发,大模型本身只是其中一个环节,但远远不是所有他们需要的东西,他们必须有一个能保证数据安全和业务安全的环境。在这个层面,首先我想强调的是,Bedrock并不是亚马逊云科技第一次推出适合用户自己进行模型训练的产品。实际上亚马逊云科技一直都有一套完整的大模型训练能力,我们也有很多的客户像Airbnb、GE等国际大企业,已经在使用亚马逊底层的计算资源、训练框架、训练平台,来进行自己大模型训练,通过Amazon产品目录,用户可以实现从数据标注、大规模分布式训练以及到机器学习模型运维和在线推理的完整的端到端的任务。
当然,有了生成式AI之后,诞生了一个新需求:如何使用用户自身的数据与适合的大模型进行定制化训练,所以我们推出了Bedrock这样的产品。Bedrock目前还处于初级阶段,很多技术细节还不方便透露协助行业轻松获取高性能基础模型,亚马逊云科技的目标是让生成式AI普惠化,但在整个开发之中Bedrock始终把数据和用户业务的安全性作为非常重要的因素。据我们了解,在开发过程中,整个Bedrock系统里的所有数据都是加密的,每个用户的环境都处于单独的私有网络环境里面,这样可以确保从网络、存储各个方面实现对数据和业务的保护。
另外一点,我们定义了一个负责任的AI服务。我们认为负责任的AI有六大支柱,包括:公平性、可解释性、隐私性、安全性、鲁棒性、治理和透明度。这是亚马逊云科技如何来定义负责任AI技术,并且为用户进行赋能。其中,隐私性和安全性是非常重要的方面。
亚马逊云科技一直都非常非常重视用户数据的隐私性和安全性,这也是Bedrock在定制化模型训练场景下,给用户所提供的核心价值。
绮观商业:最后,如果用一句话向行业推荐Amazon Bedrock,你会如何表达?
亚马逊云科技:Bedrock汇集了全托管体验、从基础模型轻松定制专属模型、数据隐私与合规、独家提供Amazon Titan基础模型、多种第三方基础选择模型等优势,使其成为客户使用基础模型构建和扩展生成式AI应用程序的最简单方法。
为展现当前生成式AI产业相关企业发展现状,绮观商业将持续深入行业走访,结合桌面研究与行业调研的形式,推出相关系列选题及行业报告。欢迎业内相关企业与我们联系,免费参与调研。
【本文来源于互联网转载,如侵犯您的权益或不适传播,请邮件通知我们删除】