為了突破這一瓶頸,蘋果研究人員開辟了一條新路,將目光投向了手機中普遍存在的閃存,也就是儲存應(yīng)用和照片的地方。在題為“閃存中的 LLM:利用有限內(nèi)存實現(xiàn)高效的大型語言模型推理(LLM in a flash: Efficient Large Language Model Inference with Limited Memory)”的論文中,研究人員提出了一種巧妙的閃存利用技術(shù),將 LLM 模型的數(shù)據(jù)存儲在閃存中。作者指出,與傳統(tǒng)用于運行 LLM 的 RAM 相比,閃存在移動設(shè)備中容量要大得多。
注意到,他們的方法巧妙地利用兩種關(guān)鍵技術(shù)繞過限制,從而最小化數(shù)據(jù)傳輸并最大化閃存內(nèi)存吞吐量:
窗口化(Windowing):可以將其視為一種回收利用的方法。AI 模型不會每次都加載新數(shù)據(jù),而是會重復(fù)使用部分已處理的數(shù)據(jù)。這減少了頻繁讀取內(nèi)存的需要,讓整個過程更加流暢高效。
行-列捆綁(Row-Column Bundling): 這種技術(shù)類似于你讀一本書時,不是逐字逐句地閱讀,而是成段地閱讀。通過更有效地分組數(shù)據(jù),可以從閃存中更快地讀取數(shù)據(jù),從而加速 AI 理解和生成語言的能力。
論文指出,這項技術(shù)可以讓 AI 模型的運行規(guī)模達到 iPhone 可用內(nèi)存的兩倍。在這項技術(shù)的加持之下,LLM 的推理速度在 Apple M1 Max CPU 上提高了 4-5 倍,在 GPU 上提高了 20-25 倍。“這一突破對于在資源有限的環(huán)境中部署先進的 LLM 至關(guān)重要,極大地擴展了它們的適用性和可訪問性,” 研究人員寫道。
更快更強的 iPhone AI
人工智能效率的突破為未來的 iPhone 開辟了新的可能性,例如更先進的 Siri 功能、實時語言翻譯以及攝影和增強現(xiàn)實中復(fù)雜的 AI 驅(qū)動功能。該技術(shù)還為 iPhone 在設(shè)備上運行復(fù)雜的人工智能助手和聊天機器人奠定了基礎(chǔ),據(jù)悉蘋果已經(jīng)開始著手這項工作。
蘋果開發(fā)的生成式 AI 最終可能被整合到其 Siri 語音助手中。2023 年 2 月,蘋果舉辦了人工智能峰會,并向員工介紹了其大型語言模型工作。據(jù)彭博社報道,蘋果的目標是打造一個更智能的 Siri,與 AI 深度集成。蘋果計劃更新 Siri 與信息應(yīng)用程序的交互方式,讓用戶能夠更有效地處理復(fù)雜問題和自動完成句子。除此之外,傳聞蘋果還計劃將 AI 添加到盡可能多的蘋果應(yīng)用程序中。
Apple GPT:口袋里的超級大腦
據(jù)報道,蘋果正在研發(fā)自己的生成式 AI 模型,代號為“Ajax”,旨在與 OpenAI 的 GPT-3 和 GPT-4 競爭,擁有 2000 億個參數(shù),暗示其在語言理解和生成方面具有高度復(fù)雜性和強大的能力。Ajax 在內(nèi)部被稱為“Apple GPT”,旨在統(tǒng)一蘋果機器學(xué)習(xí)開發(fā),這表明蘋果將 AI 更深入地整合到其生態(tài)系統(tǒng)中。
據(jù)最新報道,Ajax 被認為比早期的 ChatGPT 3.5 更加強大。然而,一些消息人士也指出,OpenAI 的新模型可能已經(jīng)超越了 Ajax 的能力。
The Information 和分析師 Jeff Pu 均聲稱,蘋果將在 2024 年底左右,也就是 iOS 18 發(fā)布之時,在 iPhone 和 iPad 上提供某種形式的生成式 AI 功能。Pu 在 10 月份表示,蘋果將在 2023 年建設(shè)數(shù)百臺 AI 服務(wù)器,2024 年還將建設(shè)更多服務(wù)器。據(jù)報道,蘋果將提供云端 AI 和設(shè)備端處理 AI 相結(jié)合的解決方案。