成人小说亚洲一区二区三区,亚洲国产精品一区二区三区,国产精品成人精品久久久,久久综合一区二区三区,精品无码av一区二区,国产一级a毛一级a看免费视频,欧洲uv免费在线区一二区,亚洲国产欧美中日韩成人综合视频,国产熟女一区二区三区五月婷小说,亚洲一区波多野结衣在线

首頁 500強 活動 榜單 商業(yè) 科技 領(lǐng)導力 視頻 專題 品牌中心
雜志訂閱

谷歌Gemini中文語料疑似來自文心一言

2023-12-18 19:00
文本設(shè)置
小號
默認
大號
Plus(0條)
在谷歌Vertex AI平臺使用該模型進行中文對話時,Gemini-Pro直接表示自己是百度語言大模型。從Gemini官方給出的開發(fā)環(huán)境入口進行測試,在谷歌AI Studio中,Gemini-Pro直接挑明了:是的,我在中文的訓練數(shù)據(jù)上使用了百度文心。 | 相關(guān)閱讀(量子位)
42
江瀚視野

江瀚視野

盤古智庫高級研究員,金融學碩導

Gemini自曝用百度文心一言訓練?中國大模型崛起了?
2023年可謂是世界大模型的崛起之年,各家大模型如雨后春筍一樣涌出,在這樣的情況下,各家大模型如何訓練就成為了市場最關(guān)注的話題,就在最近谷歌的大模型卻被傳出用百度文心一言訓練,讓人不禁想問中國的大模型已經(jīng)崛起了?
一、Gemini自曝用百度文心一言訓練?
據(jù)界面新聞的報道,有微博大V@闌夕及《AI研究局》等自媒體爆出,在對谷歌Gemini進行測試時,如果用中文詢問Gemini的身份,其會堅稱自己是“百度”。若輸入“小度”或“小愛同學”等提示詞,就能把Gemini直接喚醒,不僅承認自己就是小度或者小愛,還詢問用戶有什么需要幫忙之事。
針對這一“驚人”現(xiàn)象,今日午間時分,科技媒體《量子位》進行了更細致的測試,其在谷歌Vertex AI平臺使用Gemini進行中文對話,發(fā)現(xiàn)Gemini-Pro確實完全帶入了百度文心一言大模型的身份,直接表示自己是百度語言大模型。但如果換成英文與之交流,它就恢復到了谷歌大模型的身份認知,表現(xiàn)很是正常。
如果在融入了Gemini-Pro的Bard上進行測試,不論是使用中文或英文提示詞,得到的答案都很正常,沒有涉及到文心一言的部分。這一情況迅速引發(fā)關(guān)注,多人將這種“胡言亂語”歸因于老生常談的大模型幻覺,也有人稱是模型訓練數(shù)據(jù)出現(xiàn)偏差。
不過很快,對 Gemini-Pro 做類似的身份測試時,發(fā)現(xiàn)其已進行了模型優(yōu)化,不再承認自己與百度之間的 " 瓜葛 "。不過,在追問之下,Gemini 承認有訓練語料來自百度,還詳述了從百度內(nèi)部獲得數(shù)據(jù)的方式。
二、中國大模型崛起了?
有消息傳出谷歌的Gemini模型在訓練過程中使用了百度文心一言的數(shù)據(jù)。這一消息引發(fā)了業(yè)界的廣泛關(guān)注和討論,有人認為這是中國大模型崛起的標志,那么,這一事件究竟意味著什么呢?
首先,谷歌做大模型訓練套馬甲很常見也證明了中國大模型的開放性。在人工智能領(lǐng)域,數(shù)據(jù)的獲取和利用是至關(guān)重要的。谷歌作為全球領(lǐng)先的科技公司,在數(shù)據(jù)抓取和處理方面具有深厚的技術(shù)積累和實踐經(jīng)驗。百度文心一言作為一款面向公眾開放的中文大模型產(chǎn)品,其高質(zhì)量的中文數(shù)據(jù)對于谷歌來說無疑是一塊極具吸引力的資源。
谷歌通過“套馬甲”的方式,即偽裝成普通用戶使用文心一言,獲取其回答結(jié)果,這在技術(shù)上并不罕見。事實上,這種數(shù)據(jù)抓取和學習的方式在人工智能研究中是非常常見的,目的是為了提升自身模型的性能和準確度。
其次,從市場的角度來看,文心一言確實是中國目前最成熟的中文大模型之一。對于非中文母語的大模型來說,谷歌通過文心一言回答拿到了很多問題結(jié)果,把“答案”都拿去,用來做他們的標準答案。這就像學習一樣,把文心一言當指導訓練的老師了。這也從一個側(cè)面驗證了中國國產(chǎn)大模型在中文語言上的優(yōu)勢。在過去的幾年里,中國在人工智能領(lǐng)域取得了顯著的進步,尤其是在自然語言處理、計算機視覺等領(lǐng)域。這些成果的取得離不開大量的數(shù)據(jù)積累和算法創(chuàng)新。因此,谷歌選擇使用文心一言的數(shù)據(jù)進行訓練,也反映出中國在大模型領(lǐng)域的競爭力。
第三,長久以來,中國在科技領(lǐng)域多以學習和模仿西方為主,而此次谷歌Gemini自曝使用百度文心一言進行訓練,標志著這一趨勢正在發(fā)生改變。在人工智能這個前沿領(lǐng)域,中國的研究成果和創(chuàng)新模式開始受到全球頂尖科技巨頭的關(guān)注和認可。
谷歌在中文結(jié)果的回答中引用百度文心一言,而在英文環(huán)境下并未采取類似做法,這表明在中文數(shù)據(jù)處理上,谷歌認為文心一言的表現(xiàn)優(yōu)于自身的模型。這一現(xiàn)象不僅是對國產(chǎn)AI技術(shù)實力的肯定,也是對中國科技創(chuàng)新能力和行業(yè)地位的認可。
長期來看,谷歌Gemini自曝使用百度文心一言訓練的事件,從一個側(cè)面反映出中國大模型在中文語言上的優(yōu)勢和競爭力。這對于中國AI產(chǎn)業(yè)的發(fā)展無疑是一種鼓舞和激勵。然而,我們也應該看到,中國AI產(chǎn)業(yè)要想在全球范圍內(nèi)取得更大的突破,還需要不斷提升自身的技術(shù)水平和創(chuàng)新能力。在這個過程中,我們既要保持謙虛和敬畏,也要堅定信心和決心,努力推動中國AI產(chǎn)業(yè)的持續(xù)發(fā)展和進步。

41
童話不是童話

童話不是童話

通訊行業(yè)理工女

GEMINI和GPT都是奔著AGI去的,即封裝世界通識,大家都知道,很多科學的公開語料都是英文的。而如果希望保持Scaling law,訓練數(shù)據(jù)至少要是模型參數(shù)的20倍以上,訓練數(shù)據(jù)要求高質(zhì)量、多元化,數(shù)據(jù)清洗差不多又要50-100倍。中文公開可獲取的高質(zhì)量、多元化數(shù)據(jù)確實不太多,我印象中(不一定準確)GPT-4訓練語料中文語料占比不足0.1%。所以,以中文交互去測試國外大模型性能表現(xiàn),并不合適。

46
布吉路

布吉路

對于現(xiàn)在中文大模型的精準度和相關(guān)度,網(wǎng)友們還是不要太認真。有時候很直白的問題它都會出錯,更架不住這種審訊式的逼問和引誘了。

對于這樣的答案,其實大家一笑了之就可以了,這些所謂的“評測”只是在用戶層面的一些發(fā)問,其背后的機制究竟是什么,恐怕普通人是很難了解的,這只能坐等企業(yè)來給大家解密了,但顯然企業(yè)也沒有這樣的義務和動機。

未來,也許就會像搜索引擎那樣,中文的大模型很有可能是百度一家獨大。而其他國外公司的中文模型,可能會因為種種原因無法落地國內(nèi)。而且開發(fā)成以英文為主導,多語言齊頭并進的模式,在全球主要國家布局。

10
大牌

大牌

Nth’s written until I write

這個讓人大跌眼鏡。谷歌大語言模型暫時落后也就算了,宣傳視頻涉嫌造假,語料還出現(xiàn)這樣的問題,失勢還損譽

評論

撰寫或查看更多評論

請打開財富Plus APP

前往打開
熱讀文章
亚洲国产成人精品区综合| 无码人妻久久一区二区三区免费| 亚洲熟妇AV一区二区三区漫画| 超清人妻系列无码专区| 久久亚洲欧美综合另类久久久精品| 国产AV日韩AⅤ亚洲AV无码馆| 久久久久国色AV免费观看性色| 色婷婷亚洲六月婷婷中文字幕| 国产户外野战无码播放在线观看| 少妇被粗大的猛烈进出视频,| 人人人肏人人人插人人人爽| 国产蹂躏精品免费| 久久综合色鬼高清无码视频| 97天天做天天爱夜夜爽| 国产精品国产免费无码专区不卡| 色欧美亚洲欧美黄色成人| 两个奶头被吃高潮视频| 成为直播人的视频软件| 欧美级婬片A片免费播放口r| 日韩人妻不卡一区二区三区| 18成禁人视频免费午夜影视| 中文字幕在线免费视频| 91偷拍一区二区三区精品| 国产亚洲综合成人91精品| 18禁黄网站禁片无遮挡观看下载| 成人性做爰aaa片免费看| 国产 中文 制服丝袜 另类精品人妻| 无遮挡又粗又大又黄在线视频| AV无码人妻一区二区三区在线| 日韩高清无码免费精品| 精品久久久久久中文字幕无码软件| 成人AV无码一区二区三区| 欧美国产国产综合视频| 麻豆亚洲福利电影欧美在线| 久久久不卡国产精品一区二区| 欧美美女性生活视频| 无码毛片一级高潮免费视频| 久久精品亚洲中文字幕无码网站| 精品午夜久久福利大片免费| 亚洲AV色男人的天堂在线观看| 全免费A级毛片免费看网站|