第758章 流形學習

姚夢娜提出的這個問題,對於常浩南來說,不難理解。

只是很難解決。

真要說起來的話,這涉及到文本挖掘、數據可視化、信息檢索、數據挖掘、機器學習乃至人工智能等一系列問題。

如果真做到姚夢娜所設想的那樣全自動化生產,那就是工業4.0了。

在1999年這個時間點上,顯然不大現實。

但不可能完全實現這一整套東西,並不意味着其中沒有可以作爲突破口的部分。

比如數據挖掘和信息檢索,就是千禧年附近很火熱的研究方向。

也就是一維數據。

再假設X中的數據樣本來自於或近似來自於低維嵌入空間中的數據Y={y1,y2,…,yn}Rd。

倒是旁邊的小超市,來來往往的人流量不少。

但當年的他作爲一個工科出身的普通技術人員,並沒有太多理論功底。

“信息……”

“這個麼……”

姚夢娜看了看紙上的一個名詞和三句話,也知道常浩南大概是沒什麼思路,乾脆站起身道:

“要不先去吃個飯?”

給定一組高維數據X={x1,x2,…,xn}RD,n爲數據樣本個數,D爲高維數據的維數。

不過,這個思路卻是可以被借鑑的。

3、提取到高質量的數據特徵,提升後續的數據表示和分類任務的效果。

而對於稍複雜一些的情況來說,要完全描述一個含義,往往需要一組數據。

姚夢娜的反應稍微慢了一點,剛想起身,又意識到還沒結賬,只好掏出錢包,無奈地走向收銀臺。

“在封裝步驟之前,專門找個人在流水線旁邊看着不就行了麼?”

餐桌周圍又恢復了平靜,只剩下偶爾發出的微弱咀嚼聲。

2、消除,或者至少降低隱藏在原始高維數據中的噪聲。

“?”

但與此同時,這一組數據又往往不只能描述這一個含義。

但主成分分析法只相當於找到投影距離最小的意義下的最佳線性映射,而現實中卻沒有那麼多簡單的線性問題。

常浩南思索半晌,又在紙上寫下了三個基本條件:

幾分鐘之後,當朱雅丹都快要吃完麪前盤子裡的炒麪時,常浩南突然開口道:

確實有點餓了。

1、對原始高維數據進行壓縮,降低原始高維數據的維度,進而節省存儲空間,同時也降低高維數據的計算複雜度。

朱雅丹瞬間縮了縮頭:

“我只是隨便一說……但有些時候人腦的作用或許還是沒辦法代替的……”

實際上,在常浩南重生之前,飛機設計和製造領域已經開始應用這方面的技術,他本人也接觸過不少。

正在低頭吃飯的姚夢娜一愣,旋即意識到常浩南這還是在思考剛纔她提出來的問題。

顯然,這並不能被算作是“完整且可行”的思路。

更何況數學這種東西,光靠俺尋思是尋思不出個一二三的。

小學和中學時候做的應用題,大體上就是這樣。

常浩南放下只吃了一口的羊湯麪,蹭地站起身,快步離開食堂。

不如先放鬆一下,換個思路。

……

常浩南搖搖頭否定道。

姚夢娜猜測道:

雖然她覺得在兩位博士面前有點班門弄斧,但最後還是沒忍住:

沒有反應。

但到了99年這會,大學生在宿舍備上幾袋甚至一箱,都不算什麼稀罕事了。

而對於理論研究來說,明確地提出問題,幾乎也就相當於走完了成功之路的一半。

朱雅丹滿腦袋問號地擡起頭,但看着常浩南思考的樣子,很有自知之明地沒有打擾。

實際生活中面臨的,其實大多數也是這種問題。

十五分鐘後,三人(連同朱雅丹)已經圍坐在了食堂二層的一個圓桌旁邊。

直到一陣來自腹部的叫聲把它從深思中吵醒。

“人類的大腦能夠通過某種辦法解析高維數據,從而獲取對外部世界的感知。”

在理想化的模型中,最好是一個數據就可以精確且唯一地描述一個含義。

“換句話說,具有高維數的外部信息必定潛在於一個低維空間中的非線性流形結構上……”

常浩南面前擺着一份熱氣騰騰的羊湯麪,但卻並沒有急着動筷子,而是出神地看着不遠處樓梯口上上下下的人羣。

常浩南突然開口道:

“那個……”

要想在數學上描述這種一組(多個)數據對應多個含義的現象,就需要將一組數據在不同的維度上進行展開。

回到辦公室的常浩南重新找到了剛纔那張紙。

而如果想要讓計算機處理這些高維數據……

“你們說……”

旁邊的朱雅丹左看看常浩南,右看看姚夢娜,實在是不知道這兩個人爲什麼突然討論起這個問題了。

這裡算是個點餐制的小竈,價格比下面的大食堂貴一些,加上還要多上一層樓,因此來這裡吃飯的人並不算多。

這就導致如今他腦子裡空有一大堆名詞,但卻不知道哪個是破局的關鍵——

在近70年前,美國統計學家哈羅德·霍特林就已經提出過將高維數據進行降維的主成分分析法。

而系統,則首先需要構建出一個完整且可行的思路出來。

儘管仍然沒有給出完整的思路,但是,他至少已經把三個抽象的基本條件解析成爲了一個具體的數學問題。

“嗯……但麪餅重量本身就有誤差,而且調料包有好幾種,稱重只能證明總量沒問題,但不能保證沒放錯……”

在三個基本條件下方又寫下了幾行字。

90年代這會,方便麪還屬於非常流行的即食類食品。 常浩南讀本科那陣子,大家的條件普遍比較差,有閒錢吃得起的人不多。

而生產方便麪的企業,顯然不太可能有多麼高大上的設備和技術。

沒有靈感,說啥都沒用。

身負安保職責的朱雅丹趕緊跟上。

他認爲方差越大提供的信息越多反之提供的信息越少,於是通過原分量的線性組合構造方差大、含信息量多的若干主分量,再進行矩陣奇異值分解,實現數據維數的降低。

“調料包大概佔整包方便麪重量的10%左右,如果少放或者多放,那應該很容易檢測出來。”

姚夢娜單手扶額:

“我們就是在想,如何才能不用這個人,但實現一樣的效果。”

常浩南從旁邊扯過一張紙,在紙的最中間寫下了兩個字。

給方便麪裡面塞調料包和給飛機打鉚釘,在數學模型上其實是差不多的。

實際上,他此時就面臨着無法從大量繁雜信息中提取出有價值信息的困境。

“大概……稱重?”

但常浩南仍然沒有動筷子。

不知不覺間,常浩南就在辦公桌前枯坐到了快要吃午飯的時候。

常浩南不是那種死鑽牛角尖的人。

尋找一個從高維觀測空間到低維嵌入空間的映射關係,使得yi=(xi),以及一個一對一的重構映射關係^-1,使得xi=^-1(yi)。

仍然沒能想出一個很好的思路。

“生產方便麪的企業,是怎麼保證不漏裝或者多裝調料包的?”

而反過來,現實中收集到的信息,在多數情況下,本身就是已經展開過的高維數據。

“你說得對。”

他在腦子裡把這三條內容過了一下,然後試圖讓系統給出一個結果。

這是由數學理論推向現實的情況。

“也好。”

其核心目的是從海量數據庫和大量繁雜信息中提取出有價值的知識,並進一步提高信息的利用率。

寫到這裡,常浩南的臉上露出了一個滿意的微笑。

想到這裡,他回到這張紙的最上面,重新寫下六個字。

流形學習方法。

第1586章 小露一手第1110章 這下晉升院士境了第1392章 你們的模型,是錯的第1072章 奇怪的風扇設計327.第327章 本科畢業就被欽定是不是搞錯了第1246章 勿謂言之不預第452章 進口替代224.第224章 試驗開始第1401章 一點小問題242.第242章 在關鍵技術上要有底線思維289.第289章 我原以爲他是來輔佐我的(日萬第492章 過於先進,不便展示第1127章 遄達900,首飛!第1038章 國際數學家大會第1626章 怎麼沒按劇本來?第950章 買一送一巡航導彈?第870章 新的發動機測試平臺388.第388章 GPS干擾,我們也能做!第1037章 我對錢沒有興趣第441章 揚眉吐氣的一天!第32章 出結果了第48章第426章 金陵法拉利研發中心第1035章 沒錯,我們已經研究好了第770章 繼往開來第918章 獵鷹Z第954章 學習的速度跟不上新知識產生的速度第447章 十倍壽命,還真不是吹牛逼?第714章 常浩南的進步第1429章 海上遭遇第713章 讓美國人幫忙排除錯誤答案第972章 生產定型鑑定,以及未來的打算第657章 你知道二毛有一艘沒完工的航母吧?第154章 普適性積冰生長模型第514章 一架過於安靜的直升機?第909章 不是吧,我對常總?第1174章 資金支持第103章 製造難題(爲月票金主flankerr加更第927章 幕後臺前361.第361章 對燕京大學的無情NTR297.第297章 逐漸發力的精工計劃,第三代航第1203章 動力不是問題第1470章 爲了熱核武器第1190章 燃燒不穩定?第1398章 不會真是外星技術吧?第1540章 領先一個身位的可能第1432章 臉沒露成,倒是把屁股露出來了第520章 新加坡航展,主要展團302.第302章 沒辦法低調了(二合一)第1374章 隴原上空的閃光第1076章 F136的關鍵設計評審第1148章 倒大黴的韓國人377.第377章 集中力量,航發大會戰第635章 機彈彈彈組網協同無源定位第1438章 這下只能返航了395.第395章 渦扇10的全新設計方法第732章 法國人被卡脖子了?第1546章 我們被搞了?262.第262章 互有勝負,發現問題384.第384章 人在大堤在!第521章 這也能叫米格21改???第31章 全新的工程模型第1034章 英國人解決問題的四階段策略381.第381章 設計一個DSI進氣道練練手第784章 法國人玩脫了第1141章 三十年河東,三十年河西,莫欺第663章 可以現場看閱兵第414章 走馬上任的常總設計師第1217章 我們可不是說着玩的380.第380章 大迎角高機動(HARV)技術驗證第1587章 面子上有點掛不住了第1395章 這下觸發法國基因了第729章 給歐洲人開開眼界第1028章 真正的大合同,風水輪流轉!第17章 院士的青睞第1443章 貼臉輸出第1492章 反擊,必須反擊!第1026章 讓羅羅看不懂的生產效率第1279章 目標:突破臨近空間第821章 課題還沒開始,就已經被解決了?第749章 拿捏土耳其的籌碼第601章 NSK集團,東窗事發第917章 “小修小補”第1291章 常院士的大手伸向哪裡,哪裡的成果就氾濫成災第1380章 同位素生產反應堆第789章 暫時的勝利第927章 幕後臺前380.第380章 大迎角高機動(HARV)技術驗證第115章 專家評審(爲上月月票金主flankerr第429章 你的鬼怪我的鬼怪怎麼不一樣第1441章 面對現實第1104章 評院士還能服從調劑?第29章 國產客機的遺憾第794章 欺人太甚第1167章 像生產香腸一樣生產飛機?第117章 來自的需求(爲上月月票金主flanke第508章 把直9改的媽都不認識第796章 先記在小本本上第1526章 神秘條紋第966章 讓美國人睡不好覺
第1586章 小露一手第1110章 這下晉升院士境了第1392章 你們的模型,是錯的第1072章 奇怪的風扇設計327.第327章 本科畢業就被欽定是不是搞錯了第1246章 勿謂言之不預第452章 進口替代224.第224章 試驗開始第1401章 一點小問題242.第242章 在關鍵技術上要有底線思維289.第289章 我原以爲他是來輔佐我的(日萬第492章 過於先進,不便展示第1127章 遄達900,首飛!第1038章 國際數學家大會第1626章 怎麼沒按劇本來?第950章 買一送一巡航導彈?第870章 新的發動機測試平臺388.第388章 GPS干擾,我們也能做!第1037章 我對錢沒有興趣第441章 揚眉吐氣的一天!第32章 出結果了第48章第426章 金陵法拉利研發中心第1035章 沒錯,我們已經研究好了第770章 繼往開來第918章 獵鷹Z第954章 學習的速度跟不上新知識產生的速度第447章 十倍壽命,還真不是吹牛逼?第714章 常浩南的進步第1429章 海上遭遇第713章 讓美國人幫忙排除錯誤答案第972章 生產定型鑑定,以及未來的打算第657章 你知道二毛有一艘沒完工的航母吧?第154章 普適性積冰生長模型第514章 一架過於安靜的直升機?第909章 不是吧,我對常總?第1174章 資金支持第103章 製造難題(爲月票金主flankerr加更第927章 幕後臺前361.第361章 對燕京大學的無情NTR297.第297章 逐漸發力的精工計劃,第三代航第1203章 動力不是問題第1470章 爲了熱核武器第1190章 燃燒不穩定?第1398章 不會真是外星技術吧?第1540章 領先一個身位的可能第1432章 臉沒露成,倒是把屁股露出來了第520章 新加坡航展,主要展團302.第302章 沒辦法低調了(二合一)第1374章 隴原上空的閃光第1076章 F136的關鍵設計評審第1148章 倒大黴的韓國人377.第377章 集中力量,航發大會戰第635章 機彈彈彈組網協同無源定位第1438章 這下只能返航了395.第395章 渦扇10的全新設計方法第732章 法國人被卡脖子了?第1546章 我們被搞了?262.第262章 互有勝負,發現問題384.第384章 人在大堤在!第521章 這也能叫米格21改???第31章 全新的工程模型第1034章 英國人解決問題的四階段策略381.第381章 設計一個DSI進氣道練練手第784章 法國人玩脫了第1141章 三十年河東,三十年河西,莫欺第663章 可以現場看閱兵第414章 走馬上任的常總設計師第1217章 我們可不是說着玩的380.第380章 大迎角高機動(HARV)技術驗證第1587章 面子上有點掛不住了第1395章 這下觸發法國基因了第729章 給歐洲人開開眼界第1028章 真正的大合同,風水輪流轉!第17章 院士的青睞第1443章 貼臉輸出第1492章 反擊,必須反擊!第1026章 讓羅羅看不懂的生產效率第1279章 目標:突破臨近空間第821章 課題還沒開始,就已經被解決了?第749章 拿捏土耳其的籌碼第601章 NSK集團,東窗事發第917章 “小修小補”第1291章 常院士的大手伸向哪裡,哪裡的成果就氾濫成災第1380章 同位素生產反應堆第789章 暫時的勝利第927章 幕後臺前380.第380章 大迎角高機動(HARV)技術驗證第115章 專家評審(爲上月月票金主flankerr第429章 你的鬼怪我的鬼怪怎麼不一樣第1441章 面對現實第1104章 評院士還能服從調劑?第29章 國產客機的遺憾第794章 欺人太甚第1167章 像生產香腸一樣生產飛機?第117章 來自的需求(爲上月月票金主flanke第508章 把直9改的媽都不認識第796章 先記在小本本上第1526章 神秘條紋第966章 讓美國人睡不好覺