第20章 寫論文

二十來分鐘後,大家鍛鍊完畢,回寢室稍作整頓,盥洗一番之後,就去了食堂。

由於早起運動的關係,每個人都多吃了一個饅頭,精神頭也好了不少。

飯後溜達了一會兒,幾個人就結伴回班,上早讀。

江寒端正地坐在座位上,拿出一個嶄新的筆記本,開始寫論文的第一稿。

先寫下標題:《感知機:大腦信息存儲和組織的概率模型》。

然後是摘要:“本文探討了生物神經元的工作機制,並建立了一個簡單的數學模型,以及探索瞭如何在機器學習中運用這個模型……通過對生物神經元的模擬,來解決線性可分的二分類問題。”

寫完摘要後,又設了幾個關鍵字,接下來就進入了正文。

第一部分是背景介紹,主要討論生物神經元。

“要了解智能對知覺識別,泛化,回憶和思考的能力,首先我們要回答三個問題:生物系統如何感知或檢測物理世界的信息?以什麼形式存儲或記住信息?存儲或記憶中的信息如何影響識別和行爲?

第一個問題屬於感官生理學領域,而且人們對它已經有了可觀的認識。第二和第三個問題,目前仍然只有大量的猜測,而且神經生理學提供的一些相關事實,還沒有被整合成爲一個可以被人們接受的理論……”

開宗明義之後,接下來,就可以詳細討論生物神經元的工作機制了。

足足用了兩千來字,才寫完這些羅裡吧嗦的東西,最後下了結論。

“綜上所述,不管什麼信息被保留,都必須以某種方式,存儲爲特定響應的偏好,即信息包含在連接或關聯中!”

接下來,進入下一環節,建立數學模型。

對於很多人來說,這是論文寫作之中,最爲困難的地方。

就算拿出“感知機”這種大殺器,江寒也並不擔心,會被人懷疑是重生者。

除非屢見不鮮,否則誰會一碰到厲害的人,就懷疑是穿越、重生來的?

網上關於劉秀和王莽的段子,只是調侃和玩笑罷了。

但江寒仍然決定,將數學部分精簡一下,儘量不涉及太高深的東西。

很多高等數學的東西,大學生學起來都挺費勁,自己一個普通高中生,憑啥能熟練運用?

除非能證明自己,的確是個不世出的天才,不然很難解釋。

如果得到足夠的學術點,將七維屬性都加到10以上,那自己不想當天才都不可能。

可現在是起步階段,還是穩一點的好。

“感知機”的工作邏輯很簡單,本來也不是什麼複雜的東西,只是表述上要稍微嚴謹一點。

前世刷過的那篇同名論文,大部分內容都是枯燥的論述,數學推導並不多,關於如何在計算機上實現,則基本沒怎麼講。

這也不怪原作者,那個年代的計算機科學,本來就不怎麼發達。

而且那篇論文的精華,也就是一個模型,一個原理。

至於編程實現,有了模型之後,那還不是So easy嗎?

但現在是2012年,計算機技術已經取得了長足進步,足夠將機器學習技術,運用於生產生活實踐了。

所以,江寒將這篇論文的重點,放在了原理解析,以及如何實現上。

除了開頭第一段,江寒並沒有照抄原文,事實上,他也沒那個本事。

那麼長的論文,能記住大概思路,就相當不錯了。

一個字不差背下來?江寒做不到啊!

根據自己對該技術的理解,江寒開始自由發揮。

先從最簡單的情況,也就是單變量開始討論。

“對於只含有1個輸入信號xi的樣本集T,我們期望找到一個線性函數y=wx+b,通過輸入的數據xi和標籤yi,確定其中的權重w和偏置b,其中權重w控制輸入信號的重要性,而偏置b可調整神經元被激活的難易程度……”

江寒越寫越順,下筆如飛。

“……

我們定義損失函數如下:L(w,b)=?(1/--w--)∑y i (w?x i +b),根據預設的學習率η,不斷調整權重w和偏置b,直到損失函數到達極小點,即可得到可用的函數模型。

綜上所述,學習算法如下:

首先選定訓練數據集T=(x1,y1),(x2,y2),...,(xN,yN),yi∈{?1,+1}並指定一個學習率η(0<η<1);

1、任意選定權重w和偏置b;

2、讀入數據點(xi,yi);

3、判斷該數據點是否爲誤分類點,如果yi(w?xi+b)≤0 則更新w=w+ηyixi;b=b+ηy i;

4、重複進行2、3步,直到沒有誤分類點。

此時,我們就獲得了最佳的w和b,把它們代入y=wx+b,就得到了一個數學模型。”

感知機的學習過程,有個非常形象的比喻。

假設在一個棋盤上,有一堆黑子,和一堆白子,它們不相混合。

下面,拿一根細棍放上去。

我們希望這根棍子,能恰好將黑子和白子分開,棍子的一邊全是黑子,另一邊全是白子。

先把棍子隨機扔到棋盤上,如果恰好將黑子和白子分開了,那就皆大歡喜,否則的話,就平移和調整棍子的角度,直到所有白子和黑子恰好分開……

那根棍子就是感知機,而挪動棍子的過程,就是感知機在學習。

棍子的角度和平移量,就是要尋找的參數w和b,也就是直線(棍子)在平面直角座標系(棋盤)裡的函數解析式。

瞧,夠通俗易懂吧?

可惜寫論文就不能這麼寫了。

感知機是人工神經網絡的雛形,其中有個關鍵概念,叫激活函數,它決定了一個神經元是否有輸出。

江寒在這裡,用一個階躍函數sign(x)作爲激活函數,其定義爲: x<0時函數取值-1; x≥0時函數值爲1。

只要將sign換成sigmoid或者其他非線性函數,就是真正的單層前饋神經網絡了。

但江寒並沒有着急將sign之外的函數拋出去。

在第一篇論文裡,最重要的是提出概念,其他東西完全可以在下一篇論文中再討論。

能多水幾篇,豈不更加美滋滋?

搞定了輸入空間是1維的情況,接下來,就可以擴展到N維。

“對於一般情況,當有n個輸入信號時,假設輸入空間是x∈Rn,輸出空間是y∈{+1,-1}。輸入x∈X 表示實例的特徵向量,對應於輸入空間的點;輸出y屬於Y 表示實例的類別。

由輸入空間到輸出空間的如下函數:Ψ(x)=rsign(w1x1+w2x2+……+wnxn+b)=rsign(wTx+b),就可以稱之爲感知機,其中w∈Rn,b∈R爲感知機算法的參數……”

在討論完n個輸入信號的情況後,江寒指出:

“模型建立之後,經過訓練,就可以得到一組權重和偏置,這些參數確定了一個分離超平面(定義爲n維空間上的一個n-1維子空間),此超平面可以將訓練集中的數據,完全正確地分成兩份,一份爲正,一份爲負(或者0,可以自己定義)。”

取得了模型的參數後,就可以把測試數據放進去,根據模型函數運算的結果,就能對數據進行分類。

感知器用處很廣泛,幾乎所有二分類問題,都可以用它來試一試。

當然,必須是線性可分的問題,線性不可分的問題,是不能用單層感知器解決的。

例如年齡和有沒有生活經驗,就不存在線性關係;長得帥不帥和學習好不好,也沒有線性關係……

關於如何高效地判斷數據是否線性可分,江寒還真研究過,只是這個題目比較大,三言兩語說不清楚。

嗯……好像又能多水一篇或幾篇SCI?

第211章 就當幫他們改進一下服務質量了第366章 微服私訪?第392章 深度卷積神經網絡第167章 提醒還是邀請?第225章 papa別鬧!第418章 阿法狗不出,誰與爭鋒?第360章 造了什麼孽?第286章 破解壞蘋果第18章 就是普通同學第236章 意志堅強,沒有毛病第324章 如果是江寒哥哥的話……第386章 測量“虛擬空間”的曲率第360章 造了什麼孽?第365章 一套接着一套第14章 別帶壞了江寒第113章 刷分的可能性第306章 就剩這麼幾個了第199章 大功告成第187章 牀下的小畫冊第160章 只能看到文章本身第398章 商用級手寫識別算法第395章 柳東斌和秦易第354章 迷你3D打印機第117章 沒聽說過?第151章 那就別走了第212章 他和夏總到底什麼關係?第12章 重生的使命第63章 巧嗎?第371章 莫非換了個女朋友?第297章 Py大法威力無窮第190章 現在的高中生啊……第329章 拋棄框架,從零開始造輪子第373章 肉體永生,還是機械飛昇?第127章 只怪準備得太充分了第304章 不忘舊情,有恩必償第305章 再不用就過期了第76章 還有什麼是他不會的?第374章 手工打造LED顯示器第12章 重生的使命第133章 過去的自己,以及自己的過去第183章 成功的路上沒有僥倖第118章 《如何高效判斷數據是否線性可分》第278章 Root Me,Hack Me第135章 巧合?考驗?第230章 萬物皆可“壞蘋果”第364章 徑向基神經網絡第152章 你的承諾呢?第161章 論腦補,只服你第208章 有埋伏第159章 想怎麼看,就怎麼看?第34章 遊戲發佈第280章 這就成了“學者”了?第29章 王璐有點自閉第107章 附加條件第308章 敬可愛又無常的命運第325章 說好的理想男神呢?第320章 法無禁止即可爲第257章 NOIP中最難的題型第298章 手持利器,尤須謹慎第418章 阿法狗不出,誰與爭鋒?第200章 真的只是惡作劇嗎?第262章 貴有貴的道理第73章 臭屁不過金少樓第124章 招兵買馬第363章 終於對《我的世界》下手了……第117章 沒聽說過?第205章 江寒的心性第31章 《水果忍者》和《2048》第370章 四軸飛行器第283章 給靈感充點值第68章 舉報了、舉報了第178章 “概率圖”上的天窗第408章 初入燕園第301章 人間喜劇,喜聞樂見第200章 真的只是惡作劇嗎?第8章 裝〇也要講基本法第374章 手工打造LED顯示器第81章 不是好人第421章 身世大白第344章 好險間接那個啥第395章 柳東斌和秦易第167章 提醒還是邀請?第194章 睡不着怎麼辦?今天只有一章了第244章 屋裡陪他小電影?第7章 所謂“取整”,就是……第411章 不可不防,防不勝防第311章 系統安全特聘測試員第372章 卷積神經網絡第157章 找個清靜的地方第187章 牀下的小畫冊第410章 六度分割理論?第123章 BT小鳥第205章 江寒的心性第96章 暫時保管?第260章 這可是B5啊!第143章 別人笑我太瘋癲第132章 做個小遊戲第295章 全世界沒人教得了第53章 大功告成
第211章 就當幫他們改進一下服務質量了第366章 微服私訪?第392章 深度卷積神經網絡第167章 提醒還是邀請?第225章 papa別鬧!第418章 阿法狗不出,誰與爭鋒?第360章 造了什麼孽?第286章 破解壞蘋果第18章 就是普通同學第236章 意志堅強,沒有毛病第324章 如果是江寒哥哥的話……第386章 測量“虛擬空間”的曲率第360章 造了什麼孽?第365章 一套接着一套第14章 別帶壞了江寒第113章 刷分的可能性第306章 就剩這麼幾個了第199章 大功告成第187章 牀下的小畫冊第160章 只能看到文章本身第398章 商用級手寫識別算法第395章 柳東斌和秦易第354章 迷你3D打印機第117章 沒聽說過?第151章 那就別走了第212章 他和夏總到底什麼關係?第12章 重生的使命第63章 巧嗎?第371章 莫非換了個女朋友?第297章 Py大法威力無窮第190章 現在的高中生啊……第329章 拋棄框架,從零開始造輪子第373章 肉體永生,還是機械飛昇?第127章 只怪準備得太充分了第304章 不忘舊情,有恩必償第305章 再不用就過期了第76章 還有什麼是他不會的?第374章 手工打造LED顯示器第12章 重生的使命第133章 過去的自己,以及自己的過去第183章 成功的路上沒有僥倖第118章 《如何高效判斷數據是否線性可分》第278章 Root Me,Hack Me第135章 巧合?考驗?第230章 萬物皆可“壞蘋果”第364章 徑向基神經網絡第152章 你的承諾呢?第161章 論腦補,只服你第208章 有埋伏第159章 想怎麼看,就怎麼看?第34章 遊戲發佈第280章 這就成了“學者”了?第29章 王璐有點自閉第107章 附加條件第308章 敬可愛又無常的命運第325章 說好的理想男神呢?第320章 法無禁止即可爲第257章 NOIP中最難的題型第298章 手持利器,尤須謹慎第418章 阿法狗不出,誰與爭鋒?第200章 真的只是惡作劇嗎?第262章 貴有貴的道理第73章 臭屁不過金少樓第124章 招兵買馬第363章 終於對《我的世界》下手了……第117章 沒聽說過?第205章 江寒的心性第31章 《水果忍者》和《2048》第370章 四軸飛行器第283章 給靈感充點值第68章 舉報了、舉報了第178章 “概率圖”上的天窗第408章 初入燕園第301章 人間喜劇,喜聞樂見第200章 真的只是惡作劇嗎?第8章 裝〇也要講基本法第374章 手工打造LED顯示器第81章 不是好人第421章 身世大白第344章 好險間接那個啥第395章 柳東斌和秦易第167章 提醒還是邀請?第194章 睡不着怎麼辦?今天只有一章了第244章 屋裡陪他小電影?第7章 所謂“取整”,就是……第411章 不可不防,防不勝防第311章 系統安全特聘測試員第372章 卷積神經網絡第157章 找個清靜的地方第187章 牀下的小畫冊第410章 六度分割理論?第123章 BT小鳥第205章 江寒的心性第96章 暫時保管?第260章 這可是B5啊!第143章 別人笑我太瘋癲第132章 做個小遊戲第295章 全世界沒人教得了第53章 大功告成