4 月 13 日,由稀土掘金技術社區和 Intel 聯合主辦的 2023 第一期掘金城市沙龍「 AIGC 技術探索與應用創新」在北京成功舉辦。本期沙龍聚焦時下最熱的科技話題——AIGC,通過線上線下聯動,從“技術”和“應用”雙視角探索 AIGC 爆發式繁榮背后“算力、算法、數據”三大底層能力建設,暢想未來新的產業結構樣態與應用創新形式的可能性,在行業內引發熱烈反響。
本期沙龍分為大咖分享和圓桌 Panel 兩大議程,沙龍現場英特爾 AI 軟件工程師楊亦誠、字節跳動 NLP 算法工程師陳家澤、Google Cloud 機器學習專家王順、清華大學 KEG 知識工程實驗室研究助理鄭勤鍇、九合創投投資副總裁王逸飛、稀土掘金江昪一一帶來精彩觀點,同大家一道迎接“未來已來,將至未至”的 AIGC 時代。
AIGC 的底層邏輯:以大模型為“道”,衍生萬物
ChatGPT 爆火,引發中國互聯網科技圈對多模態大模型的關注。在國內,大模型市場更是開始躁動起來了,文心一言、盤古、通義千問、日日新SenseNova......可以說,從算力到應用,人工智能領域在大模型賽道上已然按下快捷鍵。然而,大模型仍處于從實驗室走向大規模商業化的早期階段,存在核心技術不成熟,生態系統不健全,且成熟落地場景較少等問題。
英特爾 AI 軟件工程師楊亦誠也表示,基于“大算力”和“強算法”兩大顯著特點,AIGC 類的大模型不僅從算力維度給產業帶來新的技術挑戰,更從商業模型上帶來了突破和變革,可以預見模型服務化勢必成為人工智能企業未來的核心商業模式。
盡管視覺相關的 AIGC 領域發展很猛,但是文本仍是 AIGC 中最重要的一環,是連接不同模態內容的重要媒介。字節跳動 NLP 算法工程師陳家澤表示,文本生成技術發展至今,從 Encoder Decoder 結構的第一次變革,之后各種文本生成的應用如同雨后春筍般被提出,到 GPT 結構的發展,整體文本生成范式發生演進,過程中帶來更多的可能性,同時也面臨非常多的挑戰,比如數據隱私和安全的要求越來越高,模型需要具有高可靠性和透明度等等。
同時,隨著高質量 AIGC 的大規模普及,千億規模大模型的訓練不再高不可攀。Google Cloud 機器學習專家王順也介紹到,Google不斷推出的 LaMDA、Imagen、PaLM、Parti 等生成任務大模型也打磨出了 PAX 這種輕松訓練千億規模參數的大模型框架,隨著 Cloud TPU v4 對外部客戶的 GA, 您也可以在 Google Cloud 上輕松訓練一個屬于自己的千億參數大模型。
在代碼生成的場景中,清華大學 KEG 知識工程實驗室研究助理鄭勤鍇介紹,CodeGeeX正在成為 Github Copilot 的平替,未來絕大多數代碼都將由AI驅動產生,每個開發者都需要尋找成為 AI2.0 程序員的路徑。
AI 的 iPhone 時刻:內卷的大模型,擁抱變化的開發者
AIGC 大模型的參數天花板在哪里?人工智能是否會取代重復性勞動......面對這些問題,作為圓桌主持人,稀土掘金江昪與一眾嘉賓專家從技術、商業模式、創新等視角,探討人類之于 AI 以及 AIGC 自身下一步怎么走?
隨著自然語言處理與擴散模型的發展,未來的 AIGC 必然具有極高接近性與創造力。也因此,英偉達CEO黃仁勛四度使用“iPhone時刻”,來形容AI當下的發展。清華大學 KEG 知識工程實驗室研究助理鄭勤鍇也表示,AI 帶來了交互方式上的變革,極大地提高人們使用各種工具的效率。
2020 年,OpenAI 提出了大模型的縮放法則,也就是說增大參數規模可以極大提升模型性能,由此進入了煉大模型的“狂飆”時代。而相比于 GPT-3 模型 1750 億參數量而言,關于 GPT-4 模型參數量在業界引發持續性猜想。可以確定的是,目前模型的參數量遠未到達瓶頸。九合創投投資副總裁王逸飛認為,如果在硬件側沒有一個重大突破,可能未來 2、3 年內沿著 transformer 路徑走的大模型會走到上限。AGI 是一個很長的探索路徑,未來肯定會有新的算法出來,而目前的 GPT 只是走出最靠前的一步,它很有可能只是我們探索 AGI 的中間態。
字節跳動 NLP 算法工程師陳家澤也表示,未來可能有兩條路:一是一部分的模型越來越大,同時也會越來越強;二是在一個差不多量級的模型下水平越來越高,比如可能 7B、 10B 的模型的能力通過一些訓練方式、數據調優,具備更加充分的能力。
眼下,AIGC 領域熱火朝天,國內越來越多的科技企業扎堆入場。王逸飛也表示,目前,AI 遠未到達最后階段,國內企業或團隊需要面臨最大的挑戰是,如何在沒有明確未來的事情的上敢于做投入,選擇技術路線。
那么,AI 是否會取代重復勞動力的工作,對于包括開發者在內從業者來說也是一個難題。鄭勤鍇則認為,短期內程序員是不太會被替代的,但未來的趨勢可能會分成會用 ChatGPT 和不會用 ChatGPT 這兩類程序員,在此基礎上,對于程序員提出更高的要求,就是 ChatGPT 生成的代碼并不是完全可信的,這時候就要求程序員能判斷 ChatGPT 生成代碼的質量。
AI 的長期價值,對各行各業的顛覆性改變,一切才剛剛開始。從技術研發到商用階段,再逐步走進現實生活場景中,往往需要一代又一代的開發者持續探索和完善,在每一次的技術交流中,凝聚共識,找到新的立身之本。今后,稀土掘金技術社區還會一如既往地為企業、技術人員創建一個觀點碰撞的平臺,實現雙向賦能。