ChatGPT一聲驚雷,讓全球見識(shí)到了生成式AI的威力。
當(dāng)前,生成式AI進(jìn)入一個(gè)爆發(fā)時(shí)刻,并在許多領(lǐng)域中展現(xiàn)出它的無限潛力。
OpenAI的ChatGPT iOS版,一周之內(nèi)就突破了50萬次下載。AI繪畫工具M(jìn)idjourney,憑借訂閱付費(fèi)模式,在一年內(nèi)實(shí)現(xiàn)了約1億美元的營收。
現(xiàn)在,基于AIGC的新應(yīng)用依然層出不窮。Midjourney V5.2可以無限縮放畫面,能直接制作鏡頭伸縮的視頻;Figma官宣AI設(shè)計(jì)能力,創(chuàng)意、繪圖、代碼全部包含。
整個(gè)AI圈,仿佛瞬間都活了起來。
那么,在這輪生成式AI大爆發(fā)中,企業(yè)應(yīng)當(dāng)如何抓住機(jī)遇,順應(yīng)這一波時(shí)代的潮水,得到自己的獨(dú)特紅利?
這屆亞馬遜云科技中國峰會(huì),給了我們答案。
0代碼構(gòu)建應(yīng)用
AI大爆發(fā)中,許多企業(yè)都希望能順勢(shì)抓住紅利,但無論是成本還是技術(shù)壁壘,大模型的門檻之高,都會(huì)把許多企業(yè)拒之門外。
亞馬遜云科技的Amazon Bedrock,就把大模型的門檻打了下來。
在峰會(huì)現(xiàn)場,亞馬遜云科技全球產(chǎn)品副總裁Matt Wood為我們展示了一個(gè)令人印象深刻的無代碼產(chǎn)品demo。
Matt表示:「從未有過如此簡單、低成本的方式讓每個(gè)人可以借助機(jī)器學(xué)習(xí)進(jìn)行代碼構(gòu)建。」
現(xiàn)在,根據(jù)下面這個(gè)個(gè)人用戶的每月開銷表格, 我們需要開發(fā)一個(gè)理財(cái)應(yīng)用程序。
從十幾個(gè)數(shù)字中能看出什么呢?用Amazon Bedrock向大模型提問,你會(huì)得到驚喜。
首先,在眨眼間,Amazon Bedrock就會(huì)得出對(duì)表中的信息做總結(jié),根本不用寫代碼。
在這個(gè)收入?yún)R總表中,它概括出了收入和主要支出,并列舉了出了主要支出的摘要,還總結(jié)出了每月的高頻消費(fèi)。
我們可以問Amazon Bedrock:這個(gè)表有哪些異常?
它會(huì)告訴你:從收支表可以看出,整個(gè)月的開支分配似乎相當(dāng)不平衡,沒有與儲(chǔ)蓄或投資相關(guān)的交易,整個(gè)月只有兩筆收入存款,一些支出似乎被過于低估了……總之,問題重重。
除此之外,我們還可以構(gòu)建一個(gè)個(gè)性化的財(cái)務(wù)儀表板。
我們可以問Amazon Bedrock,每年的燃?xì)忾_銷是多少?它會(huì)根據(jù)數(shù)據(jù)做出預(yù)估:大概占總支出的10%或15%。
要得出這些結(jié)論,一行代碼都不用寫,只需要用自然語言給出提示詞即可。
而Amazon Bedrock也提供了一個(gè)聊天框,這樣可以快速向用戶展示聊天界面。
最后,通過這個(gè)模型,銀行就可以向用戶提供各種理財(cái)建議,讓他們做出改進(jìn)了。
生成式AI的變革
DALL-E 2、Stable Diffusion、ChatGPT等AI工具的相繼誕生成功引爆了AIGC時(shí)代。
由此,2022年也被稱為「生成式AI元年」。
近二十年來,我們見證了從「機(jī)器學(xué)習(xí)」算法到「深度學(xué)習(xí)」,再到「基礎(chǔ)模型」的發(fā)展。
隨著數(shù)據(jù)量大規(guī)模膨脹,可擴(kuò)展的算力,再加上機(jī)器學(xué)習(xí)不斷創(chuàng)新,生成式AI走向了一個(gè)轉(zhuǎn)折點(diǎn)。
AI能夠生成內(nèi)容,是因?yàn)榛谏墒綄?duì)抗網(wǎng)絡(luò)(GAN)、預(yù)訓(xùn)練模型等技術(shù),根據(jù)已有的數(shù)據(jù)尋找規(guī)律,并通過泛化能力生成一切。
那么,生成式AI具體經(jīng)歷了怎樣一個(gè)演變,那還得從機(jī)器學(xué)習(xí)說起。
顧名思義,機(jī)器學(xué)習(xí)就是讓計(jì)算機(jī)對(duì)數(shù)據(jù)進(jìn)行學(xué)習(xí),從中找出規(guī)律,并建立模型。
根據(jù)監(jiān)督學(xué)習(xí)方法的差異,機(jī)器學(xué)習(xí)領(lǐng)域出現(xiàn)了兩種類型:判別式模型和生成式模型。
前者是對(duì)條件概率進(jìn)行建模,對(duì)給定輸入進(jìn)行分類或標(biāo)記。后者則對(duì)聯(lián)合概率進(jìn)行建模,根據(jù)已有數(shù)據(jù)生成新的內(nèi)容。
直到2014年,Ian Goodfellow等人提出的GAN,傳統(tǒng)機(jī)器學(xué)習(xí)模型逐漸轉(zhuǎn)向深度神經(jīng)網(wǎng)絡(luò)。
通過利用多層人工神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)和訓(xùn)練模型,深度學(xué)習(xí)很快展現(xiàn)出強(qiáng)大的能力。就連2016年打敗人類圍棋高手李世石的AlphaGo,其背后原理也是基于深度學(xué)習(xí)訓(xùn)練的。
與此同時(shí),生成式機(jī)器學(xué)習(xí)模型也被廣泛應(yīng)用于文本、圖像、語音等智能生成,由此,人們將其成為「生成式AI」。
隨著時(shí)間推移,可以看到,深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支,而生成式AI是深度學(xué)習(xí)的分支。
因此,生成式AI并非是全新產(chǎn)物,而是一點(diǎn)點(diǎn)演進(jìn)而來,因?yàn)槲覀兒苋菀讖拇饲氨鸬腁I模型中發(fā)現(xiàn)它的原型。
就比如,2017年,一位國外小哥Zack Thoutt等不及馬丁新作,便用AI——分支循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)續(xù)寫了「冰與火之歌」。
那么,為什么生成式AI在如今才迎來爆發(fā)呢?
首先,從模型的規(guī)模來講,更加適用于生成式AI的「大模型」,逐漸取代了「小模型」。
人們發(fā)現(xiàn),隨著參數(shù)量的不斷擴(kuò)增,更大的基礎(chǔ)模型能夠取得更好的效果,執(zhí)行越來越多的復(fù)雜任務(wù)。
因?yàn)楫?dāng)模型達(dá)到一定規(guī)模時(shí),就會(huì)出現(xiàn)一種不可預(yù)測(cè)的現(xiàn)象,即「涌現(xiàn)」能力。
其次,最值得一提的是,2017年提出的王者架構(gòu)Transformer,讓大模型訓(xùn)練變得更加容易。
比起以往RNN等架構(gòu),Transformer能夠?qū)崿F(xiàn)很好的并行性,大幅縮短了訓(xùn)練時(shí)間?;赥ransformer構(gòu)建的GPT-4、DELL-E等都是最好的例證。
第三個(gè)原因便是算力飛升,CPU/GPU硬件不斷突破、充足供應(yīng),為大模型的訓(xùn)練和推理提供了巨大算力支撐。
還有最后重要的一點(diǎn)原因是,數(shù)據(jù)量極大豐富。
一方面GAN的提出,直接突破了以往傳統(tǒng)機(jī)器學(xué)習(xí)數(shù)據(jù)局限,使得大規(guī)模無監(jiān)督學(xué)習(xí)成為可能。
另一方面,互聯(lián)網(wǎng)的發(fā)展,提供了各種圖片、文字、視頻等豐富的訓(xùn)練材料。
豐富的數(shù)據(jù),更好的模型,以及更強(qiáng)的算力,正是在諸多因素共同作用下,才使得生成式AI在當(dāng)下迎來大爆發(fā)。
生成式AI的火熱不僅意味著商業(yè)的可能性,更代表著AI進(jìn)入一個(gè)新時(shí)代。
在亞馬遜云科技中國峰會(huì)上,亞馬遜云科技全球產(chǎn)品副總裁Matt Wood提到了,生成式AI將最先在四個(gè)方面發(fā)生深刻的變革。
它們分別是:創(chuàng)意輸出、功能增強(qiáng)、交互式體驗(yàn)、決策支持。
創(chuàng)意輸出是指通過生成式AI做一些有創(chuàng)造力的工作,比如寫作、編碼、視頻、設(shè)計(jì)等。
辦公軟件能夠幫你去做總結(jié)、分析各種個(gè)性化內(nèi)容的實(shí)現(xiàn),還有進(jìn)行相關(guān)內(nèi)容搜索,都是功能增強(qiáng)的體現(xiàn)。
另外,交互式體驗(yàn)是通過與包括ChatGPT在內(nèi)的聊天機(jī)器人,進(jìn)行Q&A互動(dòng)。最后的決策支持,比如智能數(shù)據(jù)報(bào)表AI助理。
現(xiàn)在,生成式AI的大爆發(fā)就在眼前,而且還是多點(diǎn)爆破,許多企業(yè),都希望能抓住機(jī)遇。
四大挑戰(zhàn),一站式解決
然而在現(xiàn)實(shí)中,企業(yè)想要利用生成式AI,還面臨著重重困難。
比如,不是每個(gè)人都能獲得一流的模型、安全和私有的環(huán)境,以及低成本和低延遲的基礎(chǔ)設(shè)施。
那么問題來說,我們?nèi)绾巫畲蠡墒紸I在創(chuàng)意輸出、功能增強(qiáng)、交互式體驗(yàn)、決策支持等方面的潛力呢?
首先最重要的,當(dāng)然就是有性能最強(qiáng)大的一流基礎(chǔ)模型,用來構(gòu)建出色的生成式AI應(yīng)用。
有了模型之后,就需要一個(gè)安全私密的環(huán)境,用私有數(shù)據(jù)來定制化這些模型。
第三,當(dāng)然就是需要專門構(gòu)建的機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施,以實(shí)現(xiàn)低成本的推理。
最后,就需要借助專業(yè)的代碼生成工具,消除繁重的工作、大幅提升效率。
而亞馬遜云科技,正在通過種種服務(wù)產(chǎn)品,彌補(bǔ)著這一差距,爭取讓生成式AI的好處,能夠惠及所有企業(yè)。
1. 獲得一流的模型
在當(dāng)今的背景之下,大多數(shù)公司都有使用大語言模型的需要。便捷的訪問,靠譜的模型,都漸漸成為剛需。
然而,真正好的大語言模型,動(dòng)輒需要數(shù)十億美元的訓(xùn)練,還要經(jīng)歷數(shù)年的時(shí)間。
大多數(shù)企業(yè)無法自己實(shí)現(xiàn)這個(gè)過程,他們希望的是能夠從一個(gè)龐大的基礎(chǔ)模型開始改進(jìn),然后根據(jù)自己的需求進(jìn)行定制。
但包括ChatGPT和Bing AI在內(nèi)的聊天機(jī)器人,都無法避免「幻覺」的問題,會(huì)輸出看起來令人信服、實(shí)則是胡說八道的答案。
如何獲得一流的模型呢?亞馬遜云科技的Amazon Bedrock,就提供了非常好的選擇。
首先,Amazon Bedrock最重要的優(yōu)勢(shì)就在于,用戶可以將其與亞馬遜云科技的其他部分集成。這意味著,企業(yè)可以更輕松地訪問存儲(chǔ)在Amazon S3對(duì)象存儲(chǔ)服務(wù)中的數(shù)據(jù),并從亞馬遜云科技的訪問控制和治理策略中受益。
其次,通過Amazon Bedrock,用戶可以輕松訪問AI21的Jurassic-2、Anthropic的Claude、Stability AI的Stable Diffusion,以及亞馬遜云科技自己的Amazon Titan模型。
在這些模型中,最被大家熟知的應(yīng)該就是來自Anthropic的Claude了,而它的效果和性能也是一眾模型中最接近GPT-4的那個(gè)。
當(dāng)然,除了第三方的SOTA模型外,Amazon Bedrock還支持基于亞馬遜云科技在機(jī)器學(xué)習(xí)領(lǐng)域20多年經(jīng)驗(yàn)的——Amazon Titan基礎(chǔ)模型。
Amazon Titan包含了兩個(gè)大語言模型,一個(gè)是用于生成文本的Titan Text,一個(gè)是讓網(wǎng)絡(luò)搜索個(gè)性化的Titan Embedding。
Titan Text針對(duì)的是總結(jié)、文本生成、分類、開放式問答和信息提取等任務(wù)。
用戶可以通過自己的數(shù)據(jù)定制Amazon Titan模型。并且,亞馬遜云科技非常保護(hù)用戶數(shù)據(jù)隱私,不會(huì)將用戶數(shù)據(jù)拿來再訓(xùn)練Amazon Titan模型。
而且,不同于其他大模型時(shí)常會(huì)出現(xiàn)的「幻覺」,Amazon Titan在訓(xùn)練時(shí)非常關(guān)注精度,就是為了保證產(chǎn)生的響應(yīng)一定是高質(zhì)量的。
2. 安全和私有環(huán)境
雖然使用大模型是剛需,但所有客戶都不希望自己的數(shù)據(jù)被拿去訓(xùn)練模型。
此前,三星就被曝出芯片機(jī)密代碼遭ChatGPT泄露,新程序的源代碼、內(nèi)部會(huì)議記錄等機(jī)密數(shù)據(jù)都發(fā)生了外泄。
另有新聞曝出,谷歌就警告員工,在使用Bard時(shí)不要泄露機(jī)密信息,或用其生成代碼。
美國國會(huì)眾議院也在近日明確,要求職員僅可使用付費(fèi)版ChatGPT,不能使用包括免費(fèi)版ChatGPT在內(nèi)的其它AI模型,就是為了防止泄密。
在一項(xiàng)調(diào)查中亞馬遜云科技也發(fā)現(xiàn),由于數(shù)據(jù)非常寶貴,因此客戶的一個(gè)關(guān)鍵需求就是,在模型訓(xùn)練的過程中時(shí)刻保持?jǐn)?shù)據(jù)的安全和隱私。
而Amazon Bedrock的Amazon SageMaker,正提供了這樣一個(gè)安全的模型訓(xùn)練環(huán)境,可以讓客戶把預(yù)訓(xùn)練模型通過在自己的數(shù)據(jù)上微調(diào),變成一個(gè)定制化的模型。
亞馬遜云科技的副總裁表示,客戶可以使用自己的數(shù)據(jù)定制Amazon Titan模型,但這些數(shù)據(jù)永遠(yuǎn)不會(huì)用于訓(xùn)練Amazon Titan模型,可以保證其他客戶(包括競爭對(duì)手),都不會(huì)從這些數(shù)據(jù)中獲益。
3. 低成本和低延遲
而在這些基礎(chǔ)上,就需要有相應(yīng)的工具實(shí)現(xiàn)更快的開發(fā)。
推理芯片和訓(xùn)練芯片,都是為了幫助客戶去更好地實(shí)現(xiàn)算力上的高性價(jià)比。
現(xiàn)在大家面臨的情況是,GPU的成本都非常高。Sam Altman曾透露,OpenAI創(chuàng)建GPT-4的成本,已經(jīng)超過了1億美元。
而OpenAI的內(nèi)部會(huì)議上也曝出:OpenAI目前嚴(yán)重受限于GPU,訓(xùn)練大模型動(dòng)輒需要千萬美元,何況每天還有ChatGPT的上億用戶在消耗著海量的算力資源。
大模型時(shí)代,得算力者得天下。
對(duì)此,亞馬遜云科技推出的訓(xùn)練和推理芯片Amazon Inferentia、Amazon Inferentia2和Amazon Trainium,就加速了AI工具的開發(fā)過程。
Amazon Trainium是亞馬遜云科技專門為超過1000億參數(shù)模型的深度學(xué)習(xí)訓(xùn)練打造的第二代機(jī)器學(xué)習(xí)加速器。
每個(gè)Amazon Elastic Compute Cloud(EC2)Trn1 實(shí)例可部署多達(dá)16個(gè)Trainium加速器,為云中的深度學(xué)習(xí)(DL)訓(xùn)練提供高性能、低成本的解決方案。
Amazon Inferentia是亞馬遜云科技設(shè)計(jì)的一款機(jī)器學(xué)習(xí)推理加速器,可在云中提供高性能和低成本的機(jī)器學(xué)習(xí)推理。
與第一代Amazon Inferentia相比,Amazon Inferentia2加速器在性能和功能方面實(shí)現(xiàn)了重大飛躍,吞吐量提高了4倍,延遲低至前者的1/10。
在模型訓(xùn)練過程中,訓(xùn)練效率和性價(jià)比是最重要的指標(biāo)。
基于Amazon Trainium的Trn1的實(shí)例表現(xiàn),單節(jié)點(diǎn)的吞吐量可以提升1.2倍,而多節(jié)點(diǎn)吞吐量可以提升1.5倍。從成本考慮,單節(jié)點(diǎn)降低1.8倍,集群更是降低了2.3倍。
而推理往往需要考慮吞吐量和延遲。更高的吞吐量,當(dāng)然能帶來更高的性價(jià)比。然而這兩者,對(duì)于開發(fā)者來說,往往不可兼得。
Amazon Inferentia2的實(shí)例測(cè)試表明,其吞吐量可以提升3倍,延遲降低8.1倍,而成本只是1/4。
那么Amazon Inferentia2在大語言模型性能表現(xiàn)如何?
用業(yè)界常用的開源模型OPT-30B做測(cè)試,Amazon Inferentia2吞吐量增加了65%,推理成本降低52%,基本上是一半的成本。
跑視覺模型Stable Diffusion時(shí),Amazon Inferentia2可以實(shí)現(xiàn)50%更低的成本。
亞馬遜云科技的訓(xùn)練和推理芯片,能夠幫助客戶在算力上實(shí)現(xiàn)高性價(jià)比。
4. 專業(yè)的代碼生成
在有了便宜高效的算力之后,另一個(gè)讓企業(yè)開發(fā)者頭大的問題,就是代碼了。
而隨著各種Copilot,以及類ChatGPT大語言模型的發(fā)布,越來越多的開發(fā)者也開始把AI編碼輔助工具加入自己的工作流。
前段時(shí)間,GiHub就展開了一項(xiàng)關(guān)于「AI對(duì)開發(fā)者體驗(yàn)影響」的調(diào)查。
從結(jié)果來看,幾乎所有(92%)的開發(fā)人員都會(huì)在工作中使用AI編碼工具,大多數(shù)(67%)開發(fā)者在工作環(huán)境和個(gè)人時(shí)間中都使用過,不過還有6%的開發(fā)人員表示他們只在工作之外使用編碼輔助工具。
其中,更是有超過70%的開發(fā)者表示,AI編碼工具可以滿足現(xiàn)有的性能標(biāo)準(zhǔn)、提高代碼質(zhì)量、更快地輸出代碼,而且生產(chǎn)級(jí)事故也會(huì)更少。
無獨(dú)有偶,亞馬遜云科技也曾進(jìn)行過一個(gè)生產(chǎn)力挑戰(zhàn)。
結(jié)果顯示,使用自家Amazon CodeWhisperer的參與者在任務(wù)的完成率上,要比不使用的高了27%,而平均速度更是快了57%。
然而,這對(duì)于項(xiàng)目負(fù)責(zé)人來說,卻是一個(gè)不小的挑戰(zhàn)。
由于大模型的「幻覺」問題,此時(shí)的代碼和安全審查就變得尤為重要了。
為了解決這些挑戰(zhàn),亞馬遜云科技全面推出了AI加持的代碼開發(fā)工具Amazon CodeWhisperer,可以讓用戶實(shí)現(xiàn)更快、更穩(wěn)健的開發(fā)。
具體來說,經(jīng)過數(shù)十億行亞馬遜和公開可用代碼的訓(xùn)練之后,Amazon CodeWhisperer不僅可以理解用自然語言(英語)編寫的注釋,還能實(shí)時(shí)生成整個(gè)函數(shù)和代碼的邏輯塊(通常包含10-15行代碼)。
代碼生成
與此同時(shí),Amazon CodeWhisperer還會(huì)自動(dòng)過濾掉任何可能有偏見或不公平的代碼建議,并且對(duì)疑似開源代碼進(jìn)行過濾和標(biāo)記。
要知道,開發(fā)者從網(wǎng)上復(fù)制代碼片段時(shí),很可能就會(huì)復(fù)制了有安全隱患的代碼,或者對(duì)開源代碼的使用沒有進(jìn)行有效的追溯。而Amazon CodeWhisperer大大掃清了這些潛在的問題。
參考檢查
在安全方面,Amazon CodeWhisperer也是查漏洞、debug樣樣精通。而且它查起bug來還非常細(xì)致,不僅會(huì)掃描開發(fā)者編寫的代碼,甚至連自己生成的都不放過。
安全檢查
當(dāng)然,對(duì)于個(gè)人用戶來說,最重要的一點(diǎn)便是——Amazon CodeWhisperer可以免費(fèi)用!
端到端的云原生數(shù)據(jù)戰(zhàn)略
數(shù)據(jù)爆炸不是未來,而是現(xiàn)實(shí)。
生成式人工智能狂飆猛進(jìn)的背后,是海量數(shù)據(jù)在發(fā)揮著巨大的價(jià)值。
可以看到,數(shù)據(jù)不僅是AI發(fā)展的驅(qū)動(dòng)力,更是商業(yè)和社會(huì)創(chuàng)新的核心要素。數(shù)據(jù)驅(qū)動(dòng)的決策和洞察力已經(jīng)成為各行各業(yè)的競爭優(yōu)勢(shì)。
Matt在峰會(huì)上表示,「我相信數(shù)據(jù)是現(xiàn)代革新的起源,尤其是生成式AI」。
而如何管理海量數(shù)據(jù),挖掘數(shù)據(jù)價(jià)值,對(duì)每個(gè)企業(yè)來說都是巨大的挑戰(zhàn)。
當(dāng)前,我們需要的不僅僅是變革性技術(shù)和完善的基礎(chǔ)設(shè)施,更需要一個(gè)端到端的云原生數(shù)據(jù)戰(zhàn)略,進(jìn)而用數(shù)據(jù)創(chuàng)造新的idea。
而一個(gè)強(qiáng)大云原生數(shù)據(jù)戰(zhàn)略,應(yīng)當(dāng)有三個(gè)核心特征:全面的、集成的和受治理的。
1. 全面的數(shù)據(jù)服務(wù)
「全面」簡言之,能夠提供一套工具適用于任何case。
從2006年,亞馬遜云科技發(fā)布了第一個(gè)儲(chǔ)存服務(wù)Amazon S3開始,便致力于探索云原生數(shù)據(jù)服務(wù)的邊界。
亞馬遜云科技提供了一套全球領(lǐng)先的、全類別云數(shù)據(jù)庫服務(wù),以及最全面的數(shù)據(jù)分析服務(wù)。
就數(shù)據(jù)庫講,有關(guān)系型數(shù)據(jù)庫、非關(guān)系型數(shù)據(jù)庫8大類型。
在數(shù)據(jù)分析服務(wù)方面,有交互式查詢的Amazon Athena、大數(shù)據(jù)分析服務(wù)Amazon EMR、云上數(shù)據(jù)倉庫Amazon Redshift、商業(yè)智能工具Amazon QuickSight,做日志分析的Amazon OpenSearch等。
2. 互相集成數(shù)據(jù)源
此外,連接數(shù)據(jù)的能力,實(shí)現(xiàn)數(shù)據(jù)一體化融合也是非常重要。
這樣做的優(yōu)勢(shì)在于,把所有數(shù)據(jù)資產(chǎn)連接,能夠讓客戶更容易獲取數(shù)據(jù)。
當(dāng)前,亞馬遜云科技將很多產(chǎn)品之間做了深度集成,其中就包括Amazon S3、Amazon Redshift等。
而最最重要的是,亞馬遜云科技正在致力實(shí)現(xiàn)一個(gè)「Zero ETL」愿景。
ETL是指數(shù)據(jù)的提取、轉(zhuǎn)換和加載過程。以往,業(yè)務(wù)數(shù)據(jù)往往需要通過ETL,才能進(jìn)行分析從而提供洞察。
然而,這一過程非常耗時(shí)且復(fù)雜,「Zero ETL」是邁出的關(guān)鍵一步。
在Amazon re:Invent 2022全球大會(huì)上,亞馬遜云科技全新發(fā)布的Amazon Aurora zero-ETL與Amazon Redshift集成功能,能夠幫助客戶實(shí)時(shí)分析PB級(jí)交易數(shù)據(jù)。
此外,亞馬遜云科技數(shù)據(jù)服務(wù)可以與外部數(shù)據(jù)庫實(shí)現(xiàn)Zero的集成。
讓數(shù)據(jù)實(shí)現(xiàn)一體化融合,將其數(shù)據(jù)庫、數(shù)據(jù)服務(wù)底層打通,由此數(shù)據(jù)實(shí)現(xiàn)「無感知」流動(dòng)。
3. 正確的治理策略
當(dāng)前,數(shù)據(jù)爆炸性增長,為數(shù)據(jù)治理帶來了前所未有的復(fù)雜度。
要知道,良好的治理是整個(gè)團(tuán)隊(duì)可以訪問數(shù)據(jù)的基礎(chǔ)。
在數(shù)據(jù)治理過程中,通常涉及到不同團(tuán)隊(duì)、應(yīng)用和權(quán)限管理,由此當(dāng)前急需細(xì)顆粒度的數(shù)據(jù)治理。
亞馬遜云科技全新的數(shù)據(jù)管理服務(wù)Amazon DataZone,可以幫助企業(yè)對(duì)內(nèi)部數(shù)據(jù)進(jìn)行編目、發(fā)現(xiàn)、共享和治理。
通過自身17年的數(shù)據(jù)創(chuàng)新經(jīng)驗(yàn),亞馬遜云科技總結(jié)出云原生數(shù)據(jù)戰(zhàn)略的重要構(gòu)成要素。
F1、阿凡達(dá)2,全靠它
如今的AIGC大爆發(fā),突發(fā)的用量都對(duì)系統(tǒng)提出了更高的需求,當(dāng)海量用戶暴漲時(shí),如何應(yīng)對(duì)彈性變化?
基于一流的模型、安全的環(huán)境,以及低成本和低延遲的基礎(chǔ)設(shè)施,亞馬遜云科技為客戶所面對(duì)的各類棘手挑戰(zhàn)提供了支持。
比如,在世界上最受歡迎的體育賽事之一——F1賽車中,就大量用到了亞馬遜云科技的算力,形成了高性能業(yè)務(wù)場景,在高速度中進(jìn)行大量的模擬。
提供關(guān)鍵支持的,正是亞馬遜云科技的三大法寶——Amazon SageMaker、Amazon Kinesis和Amazon S3。
每輛F1賽車上都有300個(gè)傳感器,每秒可產(chǎn)生超過110萬個(gè)數(shù)據(jù)點(diǎn),并從賽車傳輸?shù)骄S修站,因此 F1 是一項(xiàng)真正以數(shù)據(jù)為驅(qū)動(dòng)的運(yùn)動(dòng)。
亞馬遜云科技能夠帶來的是,高性能計(jì)算。F1能夠運(yùn)行空氣動(dòng)力學(xué)模擬,用比以往快70%的速度開發(fā),并打造出一款能將下壓力損失從50%降低到15%的賽車。
而壓力損失的大幅降低,可以讓車手有了更多超車機(jī)會(huì),表現(xiàn)也得到提升。
此外,F(xiàn)1還利用Amazon S3上存儲(chǔ)的70年歷史比賽數(shù)據(jù),通過復(fù)雜的模型進(jìn)行分析,作為豐富的數(shù)據(jù)洞察與車迷分享,揭示出瞬間決策的細(xì)微差別,并通過這些先進(jìn)的統(tǒng)計(jì)數(shù)據(jù)突出不同車手的表現(xiàn)。
再舉個(gè)栗子,維塔數(shù)碼是全球領(lǐng)先的綜合性視覺效果公司,創(chuàng)作了《阿凡達(dá)》、《指環(huán)王》、《猩球崛起》一系列巨作。
在《阿凡達(dá):水之道》中,亞馬遜云科技在8個(gè)月內(nèi)完成了高達(dá)33億渲染線程小時(shí)的云上制作,助力其打造48FPS HFR的逼真特效并按時(shí)交付,保證了影片的順利上映。
早在2020年,視頻特效制作公司 Wētā FX 公司已將業(yè)務(wù)全面部署至亞馬遜云科技,創(chuàng)建了新的基于云的視覺特效(VFX)制作流程。
Wētā FX 在電影中創(chuàng)造了令人難忘的場景和人物,包括《阿凡達(dá)》中的納美族和潘多拉星球的美麗風(fēng)景。
亞馬遜云科技為工作室提供了最全面的內(nèi)容制作云功能集,并且使他們?cè)趲仔r(shí)內(nèi)就能建立創(chuàng)意工作站,無需耗費(fèi)幾周時(shí)間。
而工作室則獲得了近乎無限的擴(kuò)展能力,可以在亞馬遜云基礎(chǔ)設(shè)施中按需渲染。
除了以上實(shí)例,地球已經(jīng)不是云計(jì)算的邊界,亞馬遜云科技的技術(shù)已經(jīng)可以在太空這種極端環(huán)境中收集、處理數(shù)據(jù),并做出實(shí)時(shí)的決定。
生成式AI大爆發(fā),在這個(gè)人工智能的iPhone時(shí)刻,越來越多的企業(yè)想要抓住機(jī)遇,同時(shí)面臨著挑戰(zhàn)。
而面對(duì)全球算力井噴帶來的挑戰(zhàn),亞馬遜云科技通過自研芯片提供高性價(jià)比、各種豐富的彈性計(jì)算存儲(chǔ)服務(wù)組合,以及簡化算力的Serverless架構(gòu)去解決問題。
目前,亞馬遜云科技的在全球部署這無處不在的云服務(wù),全球31個(gè)區(qū)域的99個(gè)可用區(qū),已經(jīng)覆蓋了245個(gè)國家和地區(qū)。
在AI領(lǐng)域深耕25年的亞馬遜云科技,為10萬+客戶提供AI和機(jī)器學(xué)習(xí)服務(wù)來抓住當(dāng)下生成式AI挑戰(zhàn)和機(jī)遇。
從另一面來看,這個(gè)選擇是雙向的,越來越多客戶的加入也是對(duì)亞馬遜云科技AI能力和戰(zhàn)略的認(rèn)可。
在演講結(jié)尾,亞馬遜云科技全球產(chǎn)品副總裁Matt Wood引用了Bob Dylan的這首著名歌曲<The Times They Are A-Changin'>:
不要急著說話,因?yàn)檩喿舆€在旋轉(zhuǎn)
而且不知道它的名字是誰
不要站在門口,不要堵住大廳
誰停滯不前,誰就會(huì)受傷
外面有一場戰(zhàn)斗,正在肆虐
很快,它會(huì)搖晃你的窗戶,震動(dòng)你的墻壁
時(shí)代變了,我們應(yīng)該向舊傳統(tǒng)決裂。
同樣,生成式AI的到來,也在讓這個(gè)時(shí)代改變。
當(dāng)下,亞馬遜云科技正在做的,是幫助讓每個(gè)企業(yè)利用好AI,釋放生成式AI的巨大潛力。