第523章 巴別塔(4827)

打破了語言矩陣!?

謝爾蓋布林打了個激靈,視線馬上重新回到了屏幕上密密麻麻的曲線圖上。

搶過德米斯哈薩比斯手中的鼠標,謝爾蓋布林不停地向下滑動着鼠標滾輪。

大周語、普魯士語、高盧語、盎語、倭語、大毛語、西拜語、葡圖佳語、意呆利語、巴拉特語……

超過三百張曲線對比圖無一不是在說明這樣一個事實——

Juzi2.5十五種語言的各種性能曲線,幾乎全都在同一水平線之上!

無論是理解和記憶,推理與認知、自主規劃和決策、自我優化與學習、情緒與社交模擬、工具調用……

除了生成和表達存在較大的波動值之外,其他幾乎所有能力的性能,尤其是推理和認知,在各種語言環境下,幾乎是完全一樣的!

連百分之一的差距都沒有!

這怎麼可能!?

這完全違背了大模型的原理!

“是不是通過參數調整,把所有語言的性能進行了拉齊操作?或者本身先翻譯成盎語後,用盎語思考,再翻譯回思維鏈?”

謝爾蓋布林感覺自己瞬間頭頂和腋下就冒出了汗。

人工智能,所謂智能,就是思考,而思考,就需要語言,無論人還是計算機,都不可能脫離語言來思考。

大模型AI更是如此。

這些大模型,可能掌握了全世界所有的語言,但使用不同語言進行思考時,大模型的在不同方面的性能表現都是不同的。

一來,是因爲不同語言訓練資料的多寡和質量的差異。

在當今的互聯網時代,盎語語料當然是最豐富的,佔到互聯網整體資料量的百分之八十以上。

AlphaZero在使用盎語進行理解和推理的時候,正確率相對其他語言會高5%以上。

二來,各種不同的語言本身就存在不同的“表達偏重”和“性能差異”。

比如普魯士語,在結構推理方面的速度比盎語更快,西拜語則在感性類語料中優勢明顯。

而大模型在一次思考迴路中,通常使用單一語言構建其推理路徑。

雖然它可以在輸入階段識別多種語言,在輸出階段進行翻譯,但其內在的認知張量結構,仍舊傾向於使用輸入語言所構建的token空間進行語義演算。

說人話,就是大模型在思考問題的時候,在一個思考迴路中,基本只會使用一種語言來思考,你使用盎文,它就用盎文思考,你使用周文,它就用周文思考。

就算它在回覆中摻雜了其他語言,也只是一種資料引用或人類寫作風格的模仿,而不是真正的跨語種思考。

橘子大模型又怎麼可能使用不同語言思考的時候,各方面性能都差不多的?

這完全不符合常理!

唯一的可能性,就是對各種語言的思考性能進行了拉齊操作。

說白了,就是一個木桶,以最短的那個板爲基準,把高的板子都砍了。

但這樣做意義在哪?

德米斯哈薩比斯猶豫的搖搖頭:“應該不是,拉齊操作資源浪費太嚴重。”

“至於說是不是先把思維翻譯成盎語或其他語言……”

德米斯哈薩比斯停頓了一下。

“我一開始也是這麼認爲的,但經過測試,並非如此。”

說罷,哈薩比斯把實驗報告翻到中間。

“你看‘抽象歸納’和‘形式推理’這一部分的能力,哪怕在應用‘馬拉亞語’時,Juzi2.5依舊能夠準確進行抽象歸納和形式推理。”

“比如這個實例,在情感理解方面,我們的實驗人員要求Juzi用馬拉亞語思考並使用盎語將結果輸出後,針對實驗人員的任務回覆中,橘子大模型並未簡單的將馬拉亞語中的‘manja’翻譯爲‘pampered’或‘affectionate’。”

“而是採用了實際語義下的不同表達。”

“比如第一段,它對‘manja’的翻譯是‘可愛又粘人’。”

“而在第五段,思維鏈中同樣是‘manja’,但因爲主體變了,在馬拉亞語中‘manja’的含義也產生了微妙變化,這時,它將這裡的‘manja’就轉化成了‘被寵溺’。”

德米斯哈薩比斯摘下眼鏡,擦了擦,眯着眼:“盎語中原本沒有對應manja這個詞的準確翻譯,但經過這樣轉化後,哪怕是一個從未學過盎語的馬拉亞人,說出的盎語也不再會讓人有任何的誤解。”

謝爾蓋布林看向德米斯哈薩比斯指的那張曲線圖,渾身汗毛都立起來了。

作爲技術宅和古狗老闆之一,他現在肯定不是技術最好的,但對人工智能的理解和認知絕對是世界上最頂尖的一批人。

這怎麼可能呢?

馬拉亞語因爲是孤立語種,語法結構較爲扁平,文化語境偏重於口語化和情景驅動,這使得它們在抽象、哲學、技術等領域的表達中先天存在一定限制。

這導致部分高階概念性詞彙在語言本體中缺乏,往往只能依靠描述性轉譯或直接引入外來詞。

類似“意識”、“存在”、“主觀性”、“客觀性”這種哲學意象性的詞語,馬拉亞語中是不存在的,只能直接借用外來語或

但同樣,馬拉亞語中也有相當數量的“柔性詞彙”是盎語和西方語系中沒有的。

這一部分詞語的含義往往非常微妙,詞典中對應的單詞其實或多或少都存在差異。

這也就造成了,用不同語料來訓練大模型,以及用不同的語言使用大模型時,AI對世界與關係的理解是存在微妙差異的。

這種“微妙的差異”看似無所謂,實則常是文化誤解與衝突的重要誘因之一。

“謝爾蓋,這裡有個更有代表性的,就是它對‘sin’的理解。”

德米斯哈薩比斯點着觸摸板向上劃了劃:“你看這裡,這是Juzi2.5G在同一個話題中,周文和盎文的思維鏈對照。”

“哦,可能你不知道,sin,在周文中,一般翻譯爲‘罪’,但周文中‘罪’這個字的意思範圍和sin並不等同。”

德米斯哈薩比斯周裔混血,會一點周文,原本是分不清楚這裡面細微的語義差異的。

但對於他這樣的天才來說,只要他意識到其中的問題,開始研究這方面,不需要太長時間就能對這種概念性的差異一清二楚。

“可一直以來,無論任何翻譯者,基本都忽視了這一點,只是生搬硬套的直接把周文的‘罪’翻譯爲‘sin’,把盎文的‘sin’翻譯爲‘罪’。”

“Juzi2.5則不同,在闡述法律問題的時候,它把sin正常翻譯成了周文中的‘罪’。”

“而在後面的信仰問題中,它視不同語境,對sin的不同語義表達至少用周文做了六種不同表達,分別是‘忤逆’、‘冒犯’、‘過錯’、‘忘恩負義’、‘邪道’和‘苦難’。”

“這些不同的表達,在各自語境中,恰恰捕捉了‘sin’一詞在那個語境下最貼近原意的表達,基本不會因爲用詞遣句的微妙差異而導致另一方出現錯誤主觀判斷。”

“哦,對了,就連‘主觀’與‘判斷’這兩個常見詞,在周文與盎文中也呈現出微妙的語義偏移。”

德米斯哈薩比斯眼神中充滿了思索後的震撼。

謝爾蓋布林眉頭緊鎖。

他當然理解德米斯哈薩比斯的每一個術語。

但他還沒有在“哈薩比斯的語言學介紹”與“Juzi2.5在多語言條件下思維表現趨同”之間建立起完全的因果映射。

這似乎只是……更好的翻譯軟件?

和橘子大模型的性能表現有什麼關係?

不對,這種表現不在現有多語大模型能力範圍內——這背後,肯定藏着某種我們未曾掌握的機制。。

這個機制能讓橘子大模型深刻理解了不同語言在不同語境下的精確含義,在翻譯中甚至使用了“解釋替代”和“語氣擬合”來更加精準的原文翻譯。

等等,看這個實驗報告之前德米說的什麼來着?

突破語言矩陣?

之前自己還稍稍有些疑惑,這個語言矩陣是什麼。

這麼說來……

“德米,你的意思是……Juzi2.5的思考,並不是使用的某一種語言,而是……而是……”謝爾蓋急的抓耳撓腮齜牙咧嘴,但就是找不到一個合適的詞來形容自己的理解。

“而是一種徹底打破了語言邊界、使用全世界所有語言形成‘高語義映射圖譜’。”

德米斯哈薩比斯深吸一口氣,給謝爾蓋補充道。

“高語義映射圖譜!沒錯!就是這個!”

謝爾蓋布林用力的一拍大腿!

“不過,這個用詞還是太專業了,如果形象一點說……它彙總全世界的語言,創造出了一種只有它可以使用和理解的無歧義語言!”

“一種跨越語系、超越語義分歧的語言……這種語言,完全可以稱爲‘全語言’。”

說完這句話,謝爾蓋布林臉都白了,抹了抹頭上的汗,眼神掙扎,似乎還是不肯相信。

“全語言,OMG,真的存在這樣一種語言嗎?”

“哪怕是一種只有AI可以使用的語言?”

“但問題是,Juzi1.99DEC是開源的,其中根本沒有這部分功能。”

德米斯哈薩比斯點點頭:“是的,不光是1.99DEC,最早的2.5版本也未實現這一點,當時各語言輸入下的性能表現差異仍相當明顯。”

“是從發佈後第一次更新,也就是半年前的2.5N開始,具備的這個性能。”

“當時我們其實就有所發現,但沒有過分關注,就是猜測他們使用了拉齊的方式,或他們的盎文訓練語料不夠豐富所致。”

“但隨後他們的幾次版本更新,每一次都有性能提升。”

“在一個半月前,古狗大腦團隊的黎,在測試安南語等小語種的能力時,首次意識到Juzi2.5新版本在小語種上的思維能力已經超過了安南語應有的極限,推理能力和盎語相差無幾。”

“那之後,我們纔開始深入分析。”

“太震撼了,太震撼了。”

德米斯哈薩比斯搖着頭,同樣臉色發白。

“謝爾蓋,你應該知道,這意味着什麼。”

“橘子大模型連語言的藩籬都突破了,具備了優化和創造語言的能力,又怎麼可能沒有優化函數的能力!?”

“優化和創造語言,難度遠遠超過優化只有邏輯推理的函數!”

“只不過柚子科技不知道出於什麼原因,因此沒有把這部分功能釋放出來而已!”

“更重要的是,他們使用‘全語言’進行推理和認知,效率、準確率、乃至進化速度將會遠超任何一個使用單一語言進行推理的大模型。”

“這其中當然也包括我們的AlphaZero。”

“謝爾蓋,我們沒有勝算,一點都沒有。”

德米斯哈薩比斯再次摘下眼鏡,痛苦的閉上眼睛。

“就算AlphaZero能夠持續進化,真的實現從0到1的轉變,但從先天上,我們就不可能追趕上柚子科技。”

“他們打造的是巴別塔,謝爾蓋。”

巴別塔?

謝爾蓋布林臉色先是一白,緊跟着想到Y搜就是一紅,然後再想到柚米OS又是一黑。

跟喝了宮廷玉液酒似的。

也不知道是不是一百八一杯買的。

現在Y搜的市佔率雖然還不足以破壞古狗在全球搜索引擎市場的壟斷地位,但古狗內部都清楚,目前的領先僅僅是因爲安卓所帶來的碾壓式移動端搜索量。

在桌面端,Y搜對古狗的市場侵蝕已經接近古狗的百分之四十!

還好在移動端,因爲古狗是所有安卓手機除在大周外唯一的默認搜索引擎,移動端用戶又有相當大的比例不會去修改默認搜索引擎,所以古狗的市佔率仍舊穩若泰山。

但就是最近,大米居然和柚子科技合作搞出了什麼柚米OS!

讓大米提供源碼,大米卻始終以“未違反MADA默認協議”爲由,拒不提供。

目前大米公佈的Mix海外版確實沒有更換默認搜索引擎,瀏覽器引擎仍舊是古狗,但這系統還需要瀏覽器默認搜索引擎嗎?

在大米Mix發佈後三天,古狗內部就已經開了最高級別的會議,商議是否對大米啓動直裁程序。

但這種事,就是麻桿打狼兩頭怕。

大米怕被取消GMS認證,古狗也怕輿論反噬和禁止後反而讓柚米OS堂而皇之的串聯各大手機廠商。

當然,如果有邁國正府的支持和主導,這種直裁風險會小很多。

可因爲惡魔島事件,邁國國內的反裘意識高漲,再加上大選在即,這時候上面基本不可能達成一個一致意見啓動直裁。

裘德背景古狗現在實在投鼠忌器,不敢輕舉妄動,只能暫時擱置下來,待大選後再全力遊說。

可這樣一來,至少就要半年多的時間。

不,可能還會更長,更可能還會有變數,說不定永遠無法啓動直裁。

比如沃倫當選後,重啓格拉斯斯蒂格爾法案,限制裘德資本的觸角,這是大概率事件。

最重要的是,現在這個巴別塔的發現太驚人了,謝爾蓋布林完全已經坐不住了,感覺等待的每一分鐘都是在慢性自殺!

所以,必須要在大選結束後第一時間,就能讓當選者開啓直裁調查!

“拉里,現在搜索數據如何?你認爲大選誰獲勝的機率更大?”

謝爾蓋布林陰沉着臉,掏出pixel手機,在古狗Duo上給拉里佩奇發了一條信息。

“沒有任何懸念,沃倫的搜索量領先那個白癡托馬斯克頓七個百分點。”

沒多久,身在斐濟的拉里佩奇就給謝爾蓋布林回了一條信息。

沃倫……

謝爾蓋布林臉色陰晴不定。

敏珠派的意識形態很適合互聯網公司,但由於大清洗結束,內部裘德勢力十不存一,反而增加了凝聚力,現在派內反裘意識高漲。

恭賀派倒是對裘德人仍舊友好,無底線的支持伊斯力爾,同時叫囂着對國內反裘的言論與勢力進行報復。

但他們的主張不適合互聯網公司啊!

最關鍵的,還是他們贏不了!

普通人看起來選情異常焦灼的兩派,在擁有最強大數據能力的古狗看來卻洞若觀火。

搜索比差七個百分點,雖然搜索數據和大選結果之間不是完全對應,但七個點的差距,已經足以覆蓋任何誤差!

該死的ASF!

如果不是他在UN上空搞出的事情,現在古狗完全不會這麼被動!

現在簡直就是在兩個狗屎裡面選一坨不那麼臭的。

“遊說的怎麼樣了?她是否同意當選後立刻對柚子科技展開調查?”

“我們不能等下去了,既然確定沃倫一定當選,那現在就遊說吧。”

“確保她在當選第二天,就啓動柚子科技的調查!”

競爭,從來都不只是商業上的較量。

第197章 新居(第二更)第127章 低賤的凡人(第二更)第485章 消解基本敘事(剛剛看過的務必重新看346.第340章 是31?(4149)第282章 被卡脖子了(第一更)第536章 上一個這麼浪的,好像還是貝吉塔吧316.第310章 是一個人?不是一個人?(7200364.第358章 選項之外的解決方式(4300)第411章 聽句勸(4800)第228章 你纔是那盤菜(第二更)第409章 正常公司(4878)第279章 你很得意是不是(看作者的話)第433章 你們被詐騙了(4230)第453章 只是扔了罐可樂(4205)380.第374章 週一見(5259)第277章 紅彤彤的前程(第二更)第130章 宴會第524章 我真是來修路的第60章 釣魚第493章 難道不怕泄密嗎?第414章 質疑與答疑(4297)第541章 小隊(補了1000字重新看,沒改主線402.第395章 帶貨(4479)329.第323章 T800(第二更2666)第171章 絕對防禦與情書(第二更)第43章 表哥第531章 潛水鐘(4720)第455章 腦殘粉頭子(4473)365.第359章 這好處大不大?(6199)343.第337章 主動停機(補昨天的一章4439)338.第332章 首惡好像還沒處理啊(6389)第545章 愣的怕橫的,橫的怕不要命的,不要第78章 和大家聊幾句第125章 財富風暴(第二更)第487章 野生咖比怪出現了!(5015第一更,399.第393章 肘腋之疾和心腹大患(4491)第447章 迎新?(2408)第152章 晉升三級(5200大章,今天就這一更349.第343章 修仙害死人(4226第一更)第56章 富婆送的327.第321章 有大定力的女人(5066)第170章 攀爬手套與隱藏法陣(第一更)331.第325章 總要有人付出代價才行(第二更第211章 生蠔粉絲(4000字)第102章 關了燈也不一樣(第二更)第240章 你應該有更大的舞臺(5000字第二更363.第357章 被偷家了?(4113)第57章 “魔網之子”都沒有的天賦第75章 套圈(第二更)第42章 提升抗性372.第366章 經常小賺 少量小虧 偶爾大賺 絕第276章 惡人先告狀(第一更)第261章 關鍵人物(第一更)第465章 跑步過去(4093第一更)第572章 你是寧雨?(5200,記得領取大神之第218章 人機大戰(一)第229章 首次星界獻祭(第一更3500)第574章 合一(補了1700)第469章 登時就精神了(第二更)第431章 辦法找到了(4108)第17章 二次切換第45章 喜歡我?71.第71章 惡意偵測(第二更)第271章 搜索瀏覽器(第二更2500)第521章 咱大盎可沒餃子第563章 不叫你阿姨叫什麼?奶奶?(4200)第81章 邪門的魔能爆第232章 夏威夷的海灘(第二更耶耶耶)第245章 約會的最佳地點(第一更)第193章 違背祖宗的決定(第二更!)第234章 還好我機靈(第一更)第511章 天打雷劈(第一更3000)第101章 女朋友(第一更)第234章 還好我機靈(第一更)第44章 他舅舅是我爸366.第360章 託卡馬克(4200)第468章 揣摩上意(先發了第一更4000,正在第510章 一年時間第542章 是女人?第178章 去把贖金要回來(第二更)第267章 你不要過來啊!!!(第一更4500)第116章 進組(第一更)第170章 攀爬手套與隱藏法陣(第一更)322.第316章 Y搜出海(6143)第544章 楚楚可憐與純真無辜(4000)第448章 連鍋端(4365)第124章 我是財富之神(第一更)第26章 兩個選擇第3章 冥想第179章 圍殺(第三更)第231章 吃兔兔(4600字,第一更,不知道有第482章 原則上行,那就是不行(4872)第22章 埃瑟朗之核第47章 巴菲裡特訓練法第127章 低賤的凡人(第二更)第482章 原則上行,那就是不行(4872)第212章 我知道(4000字)321.第315章 單字母域名(4367)352.第346章 你再掐一個?(4071)第259章 未來已來(第一更)
第197章 新居(第二更)第127章 低賤的凡人(第二更)第485章 消解基本敘事(剛剛看過的務必重新看346.第340章 是31?(4149)第282章 被卡脖子了(第一更)第536章 上一個這麼浪的,好像還是貝吉塔吧316.第310章 是一個人?不是一個人?(7200364.第358章 選項之外的解決方式(4300)第411章 聽句勸(4800)第228章 你纔是那盤菜(第二更)第409章 正常公司(4878)第279章 你很得意是不是(看作者的話)第433章 你們被詐騙了(4230)第453章 只是扔了罐可樂(4205)380.第374章 週一見(5259)第277章 紅彤彤的前程(第二更)第130章 宴會第524章 我真是來修路的第60章 釣魚第493章 難道不怕泄密嗎?第414章 質疑與答疑(4297)第541章 小隊(補了1000字重新看,沒改主線402.第395章 帶貨(4479)329.第323章 T800(第二更2666)第171章 絕對防禦與情書(第二更)第43章 表哥第531章 潛水鐘(4720)第455章 腦殘粉頭子(4473)365.第359章 這好處大不大?(6199)343.第337章 主動停機(補昨天的一章4439)338.第332章 首惡好像還沒處理啊(6389)第545章 愣的怕橫的,橫的怕不要命的,不要第78章 和大家聊幾句第125章 財富風暴(第二更)第487章 野生咖比怪出現了!(5015第一更,399.第393章 肘腋之疾和心腹大患(4491)第447章 迎新?(2408)第152章 晉升三級(5200大章,今天就這一更349.第343章 修仙害死人(4226第一更)第56章 富婆送的327.第321章 有大定力的女人(5066)第170章 攀爬手套與隱藏法陣(第一更)331.第325章 總要有人付出代價才行(第二更第211章 生蠔粉絲(4000字)第102章 關了燈也不一樣(第二更)第240章 你應該有更大的舞臺(5000字第二更363.第357章 被偷家了?(4113)第57章 “魔網之子”都沒有的天賦第75章 套圈(第二更)第42章 提升抗性372.第366章 經常小賺 少量小虧 偶爾大賺 絕第276章 惡人先告狀(第一更)第261章 關鍵人物(第一更)第465章 跑步過去(4093第一更)第572章 你是寧雨?(5200,記得領取大神之第218章 人機大戰(一)第229章 首次星界獻祭(第一更3500)第574章 合一(補了1700)第469章 登時就精神了(第二更)第431章 辦法找到了(4108)第17章 二次切換第45章 喜歡我?71.第71章 惡意偵測(第二更)第271章 搜索瀏覽器(第二更2500)第521章 咱大盎可沒餃子第563章 不叫你阿姨叫什麼?奶奶?(4200)第81章 邪門的魔能爆第232章 夏威夷的海灘(第二更耶耶耶)第245章 約會的最佳地點(第一更)第193章 違背祖宗的決定(第二更!)第234章 還好我機靈(第一更)第511章 天打雷劈(第一更3000)第101章 女朋友(第一更)第234章 還好我機靈(第一更)第44章 他舅舅是我爸366.第360章 託卡馬克(4200)第468章 揣摩上意(先發了第一更4000,正在第510章 一年時間第542章 是女人?第178章 去把贖金要回來(第二更)第267章 你不要過來啊!!!(第一更4500)第116章 進組(第一更)第170章 攀爬手套與隱藏法陣(第一更)322.第316章 Y搜出海(6143)第544章 楚楚可憐與純真無辜(4000)第448章 連鍋端(4365)第124章 我是財富之神(第一更)第26章 兩個選擇第3章 冥想第179章 圍殺(第三更)第231章 吃兔兔(4600字,第一更,不知道有第482章 原則上行,那就是不行(4872)第22章 埃瑟朗之核第47章 巴菲裡特訓練法第127章 低賤的凡人(第二更)第482章 原則上行,那就是不行(4872)第212章 我知道(4000字)321.第315章 單字母域名(4367)352.第346章 你再掐一個?(4071)第259章 未來已來(第一更)