色爱精品视频一区,亚洲欧美韩国,男女视频在线,久久精品国产精品

歡迎訪問財(cái)經(jīng)股市網(wǎng)
首頁 > 科技 > 正文

人工智能軍備競賽白熱化:谷歌最新AI大語言模型數(shù)據(jù)量擴(kuò)充5倍

科技來源:新浪科技2023-05-17 11:00

圖片來自網(wǎng)絡(luò)/侵刪

  據(jù)報(bào)道,谷歌上周發(fā)布的最新大語言模型使用的訓(xùn)練數(shù)據(jù),幾乎是2022年的上一代模型的5倍。得益于此,該模型在編程、數(shù)學(xué)和創(chuàng)意寫作方面的表現(xiàn)更為優(yōu)秀。

  谷歌是在其I/O開發(fā)者大會上發(fā)布最新通用大語言模型PaLM2的。內(nèi)部文件顯示,該模型采用了3.6萬億個(gè)令牌(token)進(jìn)行訓(xùn)練。令牌指的是單詞串,這是訓(xùn)練大語言模型的重要基礎(chǔ),因?yàn)檫@可以教給模型如何預(yù)測字符串中可能出現(xiàn)的下一個(gè)單詞。

  之前版本的PaLM發(fā)布于2022年,當(dāng)時(shí)使用的令牌為7800億個(gè)。

  雖然谷歌很希望展示其人工智能技術(shù)的實(shí)力,以及嵌入搜索、電子郵件、字處理和電子表格后的效果,但該公司卻不愿發(fā)布其訓(xùn)練數(shù)據(jù)的規(guī)模和其他細(xì)節(jié)。微軟(311.74, 2.28, 0.74%)支持的OpenAI也對其最新的GPT-4大語言模型的細(xì)節(jié)信息保密。

  這些公司表示,之所以不披露這些信息,是出于商業(yè)競爭考慮。谷歌和OpenAI都在努力吸引想要用聊天機(jī)器人代替?zhèn)鹘y(tǒng)搜索引擎,從而直接獲取答案的用戶。

  但隨著人工智能軍備競賽日趨白熱化,相關(guān)研究人員也呼吁企業(yè)加大透明度。

  自從發(fā)布PaLM2之后,谷歌一直表示新的模型比之前的大語言模型更小,這就意味著該公司的技術(shù)效率得以提升,但卻可以完成更加復(fù)雜的任務(wù)。內(nèi)部文件顯示,PaLM2基于3400億個(gè)參數(shù)訓(xùn)練——這項(xiàng)指標(biāo)可以說明該模型的復(fù)雜程度。最初的PaLM則基于5400億個(gè)參數(shù)訓(xùn)練。

  目前,谷歌尚未對此置評。

  谷歌在一篇關(guān)于PaLM2的博文中表示,該模型使用了一種名為“計(jì)算機(jī)優(yōu)化擴(kuò)張”的新技術(shù)。這就讓大語言“更高效、整體性能更好,包括加快推理速度、減少參數(shù)調(diào)用和降低服務(wù)成本。”

  在宣布PaLM2時(shí),谷歌證實(shí)了此前的媒體報(bào)道,計(jì)該模型針對100種語言進(jìn)行訓(xùn)練,可以執(zhí)行更廣泛的任務(wù)。它已經(jīng)被用于25項(xiàng)功能和產(chǎn)品,包括該公司的實(shí)驗(yàn)性聊天機(jī)器人Bard。按照從小到大的規(guī)模劃分,該模型共有4種,分別是壁虎(Gecko)、水獺(Otter)、野牛(Bison)和獨(dú)角獸(Unicorn)。

  根據(jù)公開披露的信息,PaLM2比現(xiàn)有的任何模型都更加強(qiáng)大。Facebook在2月份宣布的的LLaMA大語言模型采用1.4萬億個(gè)令牌。OpenAI上一次披露GPT-3的訓(xùn)練規(guī)模時(shí)表示,它當(dāng)時(shí)基于3000億個(gè)令牌。OpenAI今年3月發(fā)布GPT-4時(shí)表示,它在許多專業(yè)測試中展示出“與人類媲美的表現(xiàn)”。

  LaMDA是谷歌兩年前推出的一個(gè)對話型大語言模型,在今年2月還與Bard一同對外宣傳。該模型基于1.5萬億個(gè)令牌訓(xùn)練。

  隨著新的人工智能應(yīng)用快速進(jìn)入主流,圍繞底層技術(shù)的爭議也越來越激烈。

  谷歌高級研究科學(xué)家艾爾·邁赫迪·艾爾·麥哈麥迪(El Mahdi El Mhamdi)于今年2月辭職,主要原因就是人工智能技術(shù)缺乏透明度。本周二,OpenAI CEO山姆·阿爾特曼(Sam Altman)出席美國國會針對隱私和技術(shù)舉行的聽證會,他也認(rèn)為需要設(shè)立一套新的制度來應(yīng)對人工智能的潛在問題。

  “對于一種全新的技術(shù),我們需要一套全新的框架。”阿爾特曼說,“當(dāng)然,像我們這樣的公司應(yīng)當(dāng)為我們推出的工具承擔(dān)許多責(zé)任。”

下一篇:最后一頁
【版權(quán)及免責(zé)聲明】凡注明"轉(zhuǎn)載來源"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多的信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。財(cái)經(jīng)股市網(wǎng)倡導(dǎo)尊重與保護(hù)知識產(chǎn)權(quán),如發(fā)現(xiàn)本站文章存在內(nèi)容、版權(quán)或其它問題,煩請聯(lián)系。 聯(lián)系方式:QQ:2261036103,我們將及時(shí)溝通與處理。
新聞推薦


主站蜘蛛池模板: 盘锦市| 仪征市| 浙江省| 武夷山市| 瑞丽市| 台北市| 临邑县| 临江市| 龙岩市| 堆龙德庆县| 尼玛县| 垦利县| 大田县| 民权县| 武宣县| 澄江县| 浏阳市| 金秀| 日喀则市| 会泽县| 双流县| 奉节县| 泰来县| 武安市| 墨脱县| 栖霞市| 凤庆县| 白沙| 贵港市| 广平县| 卢湾区| 南充市| 大厂| 大宁县| 秦皇岛市| 韶关市| 凤城市| 河南省| 四平市| 微山县| 牙克石市|