您的位置:首頁 > 資訊 > 行業(yè)動態(tài) > 正文

什么是生成式人工智能模型?

2023-07-12 13:21 性質:原創(chuàng) 作者:南山 來源:中叉網-中國叉車網
免責聲明:中叉網(qcxy.net.cn)尊重合法版權,反對侵權盜版。(凡是我網所轉載之文章,文中所有文字內容和圖片視頻之知識產權均系原作者和機構所有。文章內容觀點,與本網無關。如有需要刪除,敬請來電商榷?。?/div>
生成式人工智能模型是一種備受關注的高度可擴展且易于訪問的人工智能解決方案,可以補充和改變各種業(yè)務運營。生成式人工智能模型是大規(guī)模、大數據驅動的人工智能模型,為新興的生成式人工智能技術...

生成式人工智能模型是一種備受關注的高度可擴展且易于訪問的人工智能解決方案,可以補充和改變各種業(yè)務運營。

生成式人工智能模型是大規(guī)模、大數據驅動的人工智能模型,為新興的生成式人工智能技術提供動力。它們利用大型語言模型、復雜算法和神經網絡來生成原始文本、音頻、合成數據、圖像等。

盡管每天都有許多新的生成式人工智能公司和工具涌現出來,但背后運行這些工具的模型越來越少,而生成式人工智能的能力增長變得越來越重要。

請繼續(xù)閱讀,詳細了解生成式 AI 模型的定義、工作原理以及與其他類型 AI 的比較,以及當今可用的一些頂級生成式 AI 模型。

(1) 生成式AI 模型定義

生成式人工智能模型是一種基于海量訓練數據集、神經網絡和深度學習架構,通過用戶的提示生成各種輸出的人工智能平臺。

根據使用的生成式 AI 模型類型,您可以生成圖像、將文本轉換為圖像輸出(反之亦然)、合成語音和音頻、創(chuàng)建原始視頻內容以及生成合成數據。盡管存在許多不同的子集和新格式的生成人工智能模型,但兩種主要設計是:

生成對抗網絡

生成對抗網絡 (GAN) 的組件包括兩個不同的神經網絡:生成器和鑒別器。生成器根據用戶輸入和訓練數據生成內容,而鑒別器模型根據“真實”示例評估生成的內容,以確定哪個輸出是真實的或準確的。

基于變壓器的模型

使用基于變壓器的模型,平臺內置編碼器和/或解碼器來解碼令牌或根據用戶輸入分段的內容塊。

生成式人工智能模型與判別式人工智能模型

生成式人工智能模型和判別式人工智能模型的主要區(qū)別在于,生成式人工智能模型可以根據訓練數據創(chuàng)建新的內容和輸出。

另一方面,判別建模主要用于通過監(jiān)督學習對現有數據進行分類。例如,蛋白質分類工具運行在判別模型上,而蛋白質生成器則運行在生成人工智能模型上。

生成式與預測式 AI 模型

生成模型旨在創(chuàng)造新事物,而預測人工智能模型則旨在根據現有數據進行預測。繼續(xù)我們上面的例子,預測蛋白質分子中下一個氨基酸片段的工具將使用預測性人工智能模型,而蛋白質生成器將使用生成式人工智能模型方法。

(2) 生成式人工智能模型的類型

如今,有許多類型的生成式人工智能模型在運行,并且隨著人工智能專家對現有模型進行實驗,數量還在不斷增長。

根據以下分類,請記住一個模型可以適用于多個類別。例如,ChatGPT 和 GPT-4 的最新更新使其成為基于 Transformer 的模型、大型語言模型和多模態(tài)模型。

● 生成對抗網絡(GAN):最適合圖像復制和合成數據生成。

● 基于 Transformer 的模型:最適合文本生成和內容/代碼完成?;?Transformer 的模型的常見子集包括生成式預訓練 Transformer (GPT) 和來自 Transformer (BERT) 模型的雙向編碼器表示。

● 擴散模型:最適合圖像生成和視頻/圖像合成。

● 變分自動編碼器 (VAE):最適合圖像、音頻和視頻內容創(chuàng)建,特別是當合成數據需要逼真時;設計有編碼器-解碼器基礎設施。

● 單峰模型:僅接受一種數據輸入格式的模型;當今大多數生成式人工智能模型都是單峰模型。

● 多模態(tài)模型:旨在接受多種類型的輸入并在生成輸出時進行提示;例如,GPT-4 可以接受文本和圖像作為輸入。

● 大型語言模型:大型語言模型(LLM) 是目前最流行和最知名的生成式 AI 模型,旨在大規(guī)模生成和完成書面內容。

● 神經輻射場 (NeRF):新興的神經網絡技術,可用于基于 2D 圖像輸入生成 3D 圖像。

(3) 生成式人工智能模型如何工作?

通過無監(jiān)督或半監(jiān)督學習方法,生成式人工智能模型經過訓練,可以識別訓練數據集中的小規(guī)模和總體模式和關系,這些數據集來自各種來源(如互聯網、維基、書籍、圖像庫等)。

這種訓練使生成式人工智能模型能夠在生成新內容時模仿這些模式,讓人們相信內容可能是由人類而不是機器創(chuàng)建或屬于人類而不是機器。

生成式人工智能模型之所以能夠如此精確地復制實際的人類內容,是因為它們使用模擬人腦神經元之間突觸的神經網絡層來設計。當神經網絡設計與大規(guī)模訓練數據集、復雜的深度學習和訓練算法以及頻繁的重新訓練和更新相結合時,這些模型能夠隨著時間的推移和大規(guī)模地改進和學習。

(4) 生成式人工智能模型是如何訓練的?

生成式 AI 模型的訓練方式有所不同,具體取決于您訓練的模型類型。在這里,我們將討論基于 Transformer 的模型、GAN 和擴散模型的訓練方法:

基于 Transformer 的模型訓練

基于 Transformer 的模型利用大規(guī)模神經網絡和 Transformer 架構設計,使模型能夠識別和記住順序數據中的關系和模式。

首先,這些模型經過訓練,可以查看、存儲和記住來自各種來源(有時是不同格式)的大型數據集。訓練數據源可以是網站和在線文本、新聞文章、維基百科、書籍、圖像和視頻集合以及其他提供有價值信息的大型數據集。

然后,變壓器模型可以將所有這些數據放入上下文中,并通過學習到的上下文有效地關注訓練數據集中最重要的部分。模型在訓練中識別的序列將指導其如何響應用戶的提示和問題。基本上,基于 Transformer 的模型會選擇下一個最符合邏輯的數據來生成數據序列。

GAN模型訓練

GAN 模型使用兩個不同的子模型神經網絡進行訓練:生成器和判別器。

首先,生成器根據隨機噪聲信號創(chuàng)建新的虛假數據。然后,判別器盲目地將虛假數據與模型訓練數據中的真實數據進行比較,以確定哪些數據是真實的或原始的。

這兩個子模型不斷循環(huán)執(zhí)行該過程,直到判別器無法再發(fā)現新生成的數據與訓練數據相比的缺陷或差異為止。

擴散模型訓練

擴散模型需要進行正向和反向訓練,也稱為正向擴散和反向擴散。

正向擴散過程涉及向訓練數據添加隨機噪聲。當反向擴散過程開始時,噪聲會逐漸從數據集中消除或反轉,以生成與原始質量相匹配的內容。

在這種情況下,噪聲最好定義為導致您不希望保留在最終數據集中的行為的信號,但可以幫助您逐漸區(qū)分正確和不正確的數據輸入和輸出。

(5) 生成式人工智能模型的示例

下面列舉了一些當今最流行的生成式人工智能模型示例。請注意,許多生成式人工智能供應商都使用以下模型之一作為基礎或核心模型來構建他們的流行工具。例如,微軟的許多新 Copilot 工具都是基于 OpenAI 的 GPT-4 運行的。

●GPT-3/3.5/4等:GPT-3、GPT-3.5和GPT-4是由 OpenAI 管理、擁有和創(chuàng)建的不同代的GPT基礎模型。最新版本 GPT-4 使用多模態(tài) LLM,這也是 ChatGPT 的基礎。

●OpenAI Codex:OpenAI 的另一個模型,Codex 可以根據自然語言提示生成代碼和自動完成代碼。它是 GitHub Copilot 等工具的基礎模型。

●Stable Diffusion:Stable Diffusion 是 Stability AI 最流行的擴散模型之一,主要用于文本到圖像的生成。

●LaMDA:LaMDA 是 Google 的基于 Transformer 的模型,旨在支持對話用例。

●PaLM:另一個來自 Google 的基于 Transformer 的模型,PaLM 旨在支持多語言內容生成和編碼。PaLM 2 是該模型的最新版本,也是 Google Bard 的基礎。

●AlphaCode:AlphaCode 是 DeepMind 的開發(fā)人員和編碼支持工具,是一種大型語言模型,可以根據自然語言輸入和問題生成代碼。

●BLOOM:Hugging Face 的 BLOOM 是一種自回歸、多語言的法語模型,主要用于完成缺少文本的句子或缺少代碼的代碼字符串。

●LLaMA:LLaMA 是 Meta 中的一個較小的大型語言模型選項,旨在使資源有限的用戶更容易訪問生成式 AI 模型。

●Midjourney:Midjourney 是一種生成式 AI 模型,其運行方式與 Stable Diffusion 類似,可以根據用戶提交的自然語言提示生成圖像。

(6) 生成模型可以做什么?

經過適當的訓練并提供相關提示后,生成模型可以完成各種業(yè)務和個人任務。您可以使用生成式 AI 模型來處理以下任務以及更多任務:

●生成并完成文本。

●生成并完成代碼和代碼文檔。

●生成圖像、視頻和音頻。

●生成合成數據。

●設計蛋白質和藥物。

●回答問題并支持研究。

●優(yōu)化醫(yī)療診斷圖像。

●創(chuàng)建身臨其境的故事講述和視頻游戲體驗。

●提升客戶支持體驗。

自動化并提高網絡安全和風險管理的可見性。

(7) 底線:生成式人工智能模型的潛力和局限性

生成式人工智能模型是一種高度可擴展且易于訪問的人工智能解決方案,可以補充和改變各種業(yè)務運營,甚至是十分聰明的高中生的英語論文,因此它們在廣告中得到了充分的宣傳。

然而,對于這些工具的工作原理、缺乏透明度和內置的安全保障措施以及生成人工智能的整體道德準則,人們仍存在許多擔憂。無論您的組織是致力于開發(fā)生成式 AI 模型、構建基礎模型,還是只是使用 ChatGPT 執(zhí)行日常任務,請記住,使用生成式 AI 模型的最佳方式是進行全面的員工和客戶培訓,并制定明確的道德使用政策。

網友評論
文明上網,理性發(fā)言,拒絕廣告

相關資訊

關注官方微信

手機掃碼看新聞