今年春節檔的中國科幻電影《流浪地球2》以氣勢恢宏、震撼人心、美輪美奐的視覺奇景而又極具現實意義的科幻設定引起了熱議,“燃爆”全網,全球圈粉。片中領航站空間的核心智能主機MOSS以其趨于完美的智慧讓大家對科技強國的繁榮盛景充滿了無限想象與期待。無獨有偶,去年11月30日美國人工智能研究公司OpenAI推出的聊天機器人ChatGPT火爆全球,一時間作為現象級消費類人工智能應用,再次引發人工智能熱潮。本期,我們對“生成式人工智能”進行專題解讀。
人工智能(Artificial Intelligence,AI)是計算機學科的一個分支,作為21世紀三大尖端科技之一,是研究用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門技術科學。人工智能的目標是使機器能夠像人一樣完成一些復雜的任務,例如語音識別、圖像識別、機器翻譯、自動駕駛、醫學診斷等。
人工智能的誕生可以追溯到1956年,美國達特茅斯學院舉行了歷史上第一次人工智能研討會,約翰·麥卡錫等科學家認為機器可以像人類一樣學習、記憶、思考、判斷和解決問題,人工智能這門學科由此誕生。
人工智能的發展走過60多年,經歷了兩次低谷和三次高潮,目前已廣泛應用在各領域,如智能交通、智能醫療、智能金融、智能制造、智能安全、智能物流等。人工智能被視為眾多智能產業發展的突破點、新一輪產業變革的核心驅動力、一項引領未來的戰略技術。
人工智能
生成式人工智能(Generative AI)是一類人工智能技術,可以通過學習現有的數據并生成新的數據,從而實現類似人類創造力的功能。與傳統的人工智能技術不同,生成式人工智能技術能夠創造出新的內容,而不是只能根據輸入的數據進行處理和分類。
生成式人工智能的關鍵技術在2013年以后有了重要發展。2014年,科學家蘭·J·古德費羅提出了生成式對抗網絡GAN。2018年,英偉達公司發布了可以自動生成高質量圖片的StyleGAN模型。2019年,DeepMind公司發布了可以生成連續性視頻的DVD-GAN模型。2022年底,用于生成自然語言的ChatGPT橫空出世。2022年也被稱為AIGC元年。
AIGC(AI Generated Content)是指利用人工智能技術來生成內容,從給定的數據中學習出模型,然后使用模型生成新的數據。根據其生成的內容模態不同,可分為文本、視頻、圖像、音頻與跨模態生成。AIGC是繼專家生成內容(Professionally Generated Content,PGC)、用戶生成內容(User Generated Content,UGC)之后的新型內容生產方式。隨著生成式人工智能技術不斷迭代發展,人工智能生成內容種類多樣、豐富且效果逼真,生成方式逐漸由PGC、UGC轉變為人工智能輔助生產內容生成(AI Assisted Generated Content)。
生成式人工智能
ChatGPT
ChatGPT是OpenAI推出的一款基于Transformer模型的自然語言生成技術構建的人工智能聊天機器人。
ChatGPT能夠根據用戶的文本輸入,產生相應的回答,還能夠撰寫文章、文本摘要,進行翻譯,生成計算機代碼。它支持連續多輪對話,承認錯誤、承認無知、質疑不正確的前提并拒絕不恰當的請求。ChatGPT在對話的過程中能夠記憶先前的對話訊息,并進行上下文理解,以回答某些假設性的問題。與其他現有聊天機器人相比,ChatGPT極大提升了對話交互模式下的用戶體驗。
根據用戶的文本輸入產生相應回答,ChatGPT解決的是一個關于自然語言處理的序列生成類型的問題。人類使用自然語言表達一個句子時,其中的詞通常是有先后順序的,一段話中,前后語句是有聯系的,因此,通常采用機器學習中的序列模型來解決該類問題。
ChatGPT是通過基于Transformer的大型預訓練模型和基于人類反饋的強化學習(Reinforcement Learningfrom Human Feedback,RLHF)兩階段實現而成。第一階段的大型預訓練模型為ChatGPT的基礎模型,采用的是基于Transformer的預訓練范式。在第二階段中,ChatGPT采用RLHF解決大語言模型的不一致問題。
Transformer是一種基于注意力機制的深度神經網絡序列模型。注意力機制可以幫助模型更好捕捉輸入數據中的重要特征,而不是像傳統模型那樣對所有特征“一視同仁”,注意力機制有效提高了模型的準確性?;A模型使用了多層的注意力機制來處理輸入序列,以此捕捉句子級別的依賴關系。
ChatGPT生成的語言自然流暢,這得益于基礎模型通過大量的高質量網絡文本數據學習出自然語言的語法和語義。這些文本數據來自Common Crawl、新聞文本數據、Reddit評論數據、書籍、維基百科及其他文本數據。
與ChatGPT相比,此前發布的GPT1-3是一種通用模型,可以用于多種自然語言處理任務,比如文本分類、文本生成、文本摘要,而ChatGPT模型專注于聊天機器人,根據上下文和歷史對話,使得生成的回復更加貼切。
ChatGPT發布僅兩個月以來,活躍用戶就突破1億,全球大量用戶已經開始嘗試使用該平臺協助撰寫電子郵件、開發代碼以及回答有關投資等一系列主題的問題。ChatGPT亮相Bing搜索和瀏覽器,被稱為微軟的“核彈級”更新,開啟了搜索引擎的新范式。Bing搜索引擎發布會上有趣的展示給人留下了深刻印象——人工智能助手在不到10秒的時間內總結了GAP三季度長達15頁PDF財報的要點,接著根據“列個表和lululemon對比下”的指令,給出了財報要點對比表格。發布會的演示者指出,人工智能助手在購物、旅行規劃、飲食、娛樂、跨界學習、100多種語言的文本交流等方面可以提供咨詢和幫助。ChatGPT被亞馬遜用于各種不同的工作職能中,如回答面試問題、編寫軟件代碼和創建培訓文檔等。ChatGPT通過了美國沃頓商學院的MBA考試以及美國醫師執業資格考試。
ChatGPT的爆紅,成為人工智能時代資本定價的標桿事件,OpenAI成為賬面上最值錢的美國初創公司之一,于今年1月獲得了微軟100億美元的投資。美國新媒體巨頭Buzzfeed宣布計劃采用ChatGPT協助內容創作,其股價一夜間暴漲近120%,兩天內飆升逾300%。采用了同類底層技術(GPT-3)的文案自動生成平臺Jasper在成立僅18個月后就達到了15億美元的高估值,ChatGPT的巨大商業潛力不斷顯現。國內科技龍頭企業也高度關注ChatGPT,百度的“文心一言”(ERNIE Bot)將在3月完成其ChatGPT產品的內測,面向公眾開放。2月,騰訊也公布了一項實現機器與用戶自然順暢溝通的人機對話專利。
ChatGPT的優勢與局限
ChatGPT的強大來自四個方面。一是借助于預訓練模型,建立了基于注意力機制的大規模自監督訓練的基礎模型,極大減輕了對于標注數據的依賴。二是使用了來自人類反饋的強化學習方案,提高了理解人類思維的準確性。三是計算機硬件的改進以及利用硬件并行性的Transformer模型架構的提出,使得大規模訓練數據成為可能。四是采用了大規模高質量的真實數據及多任務精標數據。這四個方面反映了算法、算力與海量數據集成在一起產生的巨大價值。
ChatGPT的缺點也比較明顯。例如,目前還并不具備網絡搜索功能,只能基于所擁有的數據集進行回答;有時會給出看似合理但并不正確或甚至荒謬的答案;抵抗不安全的指令能力較差,存在過分猜測用戶意圖的問題;部分回復廢話較多、句式固定。另一方面,ChatGPT的訓練數據達到了45TB,消耗了巨大的算力資源,訓練時間長,這也致使很多公司和企業在自建道路上望而卻步。
ChatGPT與生成式人工智能的應用潛力
ChatGPT成為人工智能從量變到質變的轉折點,對于文字模態的生成式人工智能應用具有重要意義,其應用場景大致可分為4類:信息查詢、專家咨詢、助手、交流,通過數字化勞動替代枯燥重復性勞動、擴充資源稀缺勞動力、協助人類完成相應任務、滿足人類情感交流的需求。
ChatGPT可以依附于對話形態的產品和載體,如內容創作、客服機器人、虛擬人、機器翻譯、游戲、社交、教育、家庭陪護等領域,這些或許都將是ChatGPT能快速落地的方向。
生成式人工智能借助大模型的跨模態綜合技術能力將在跨模態產業生態中逐漸成熟,跨模態生成技術的成熟是真正實現認知和決策智能的轉折點?;谏墒饺斯ぶ悄芗夹g的數字內容孿生、數字內容創作以及數字內容智能編輯有望在電子商務、傳媒、影視娛樂等領域改變內容生產模式。
本版文字除署名外均由集團公司郵政研究中心提供
更多關于 美國 的信息
商函中心美國必能寶系列封裝機維保服務采購項目招標公告(2022-11-09)
安徽郵政9610美國商業專線首發成功(2022-02-17)
美國貨運公司實施全天候服務(2021-11-25)
美國郵政榮登福布斯年度“美國最佳雇主”排行榜榜首(2021-10-14)
美國郵政推出咖啡永久郵票(2021-07-15)
接入點:美國特色的包裹攬投點(2020-06-18)
美國“雙11”,is coming(2017-11-09)
郵政速遞物流牽手美國華人快遞公司(2016-10-19)
本站部分文章轉載于網上,版權歸原作者所有。如果侵犯您的權益,請Email和本站聯系!