圖靈學院內的文章包含三大主題:ESG浄零實驗室、AI實驗室及精實管理實驗室,我們會不定期分享相關主題之文章,也歡迎並對前述主題有興趣的學員投稿分享您的見解  (我要投稿)

圖靈學院創辦人 科楠老師的願景

非歐幾何與第五公設的顛覆:從數學革命到AI演算法的突破應用

 

 

圖靈學院
科楠
2025-6-16

 

前言:一條不平行的路,開啟幾何新視野

 

    人類對空間與形狀的理解,數千年來建立在歐幾里得幾何的堅實基礎上。這種幾何邏輯幾乎是我們從小在課堂上所學的唯一模型,從直線、平行線到三角形的內角和等於180度,這一切看似理所當然。

 

事實上,一般人幾乎只知道這種平坦空間的幾何。我自己曾經好奇地問了一些大學電機系的朋友:「你們知道非歐幾何嗎?」結果得到的多半是尷尬的微笑和「好像在哪聽過,但不太確定是什麼」的回答。這也難怪,非歐幾何一直以來都像是數學世界中的隱藏分支,除非深入研究,否則往往與日常理解無緣。

 

那我為什麼要寫這篇來探討幾何學?因為在AI與神經網路的世界裡,幾何學早已不是抽象的數學思維遊戲,而是許多演算法架構背後的深層邏輯。你所認識的卷積神經網路(CNN)、圖神經網路(GNN)、甚至是語意嵌入(semantic embeddings),它們的運作都脫離不了一個核心問題:如何在高維甚至彎曲的空間中,有效表徵資料的幾何結構與關聯性。

 

因此,當第「五公設」被質疑,整個幾何宇宙便因此改變。非歐幾何(Non-Euclidean Geometry) 不只是數學的一場革命,更是現今 AI 與深度學習在高維空間中建模的關鍵理論基石。

本文將帶你深入探索非歐幾何與歐幾里得幾何的根本差異,並揭示它如何在卷積神經網路、圖神經網路與超球面學習等 AI 領域中,帶來突破性的應用。


一、歐幾里得幾何的第五公設:邏輯體系的破口

 

    歐幾里得幾何建構於《幾何原本》的五大公設之上,前四條簡單直觀,但第五條卻複雜又難以直觀理解:

 

「若一直線與兩直線相交,使同側內角和小於兩直角,則這兩直線在此側延伸將相交。」

 

這條被稱為「平行公設」的命題,本質上是對“唯一平行線”的斷言:給定一條直線與線外一點,僅存在唯一一條與該直線平行、不相交的直線通過此點。

 

問題在於,為何這條命題不能像其他四條一樣被證明?18至19世紀,許多數學家(包括高斯、羅巴切夫斯基、波耶-巴喬里)試圖以其他公設推導此命題,最終卻意外發現——當不採用第五公設時,仍可建構自洽的幾何系統,並誕生了兩種主要的非歐幾何:

 

  • 雙曲幾何(Hyperbolic Geometry)
  • 橢圓幾何(Elliptic Geometry)


二、非歐幾何的誕生:平行線不再唯一

 

雙曲幾何:多條平行,空間變曲

 

在雙曲幾何中,給定一條直線與其外一點,有無限多條不相交直線通過該點。這類幾何適用於負曲率空間,如龐加萊圓盤模型(Poincaré Disk Model)與龐加萊上半平面模型。

   


橢圓幾何:沒有平行線,三角形也「不守規矩」


在橢圓幾何(Elliptic Geometry)中,所有直線最終都會相交,換句話說——根本沒有平行線的存在。這聽起來或許難以想像,但我們日常生活中其實早就接觸過這樣的空間:地球表面就是一個典型的橢圓幾何範例。

 

想像你在地球上畫一個「三角形」,例如:

 

第一條邊沿著赤道向東走

 

第二條邊從某個點轉向北極

 

第三條邊從北極再回到起點

 

你會發現這個「三角形」的三個角加起來大於180度!這違背了我們在教科書中學到的「三角形內角和等於180度」的規則,因為這條規則只適用於平坦的歐幾里得幾何空間。


類似地,在雙曲幾何(例如龐加萊模型)中,三角形的內角和反而會小於180度。

 

✅ 用一句話總結:

 

在非歐幾何裡,空間彎曲會改變角度的總和與直線的命運。

 

這種幾何的特性不僅在天文學與廣義相對論中極為重要,當代AI演算法也借助這種空間來表示複雜的資料結構,如層級關係與語義網絡。


三、非歐幾何在神經網路的革命性應用

 

1. 高維資料的幾何需求:為何需要非歐幾何?

 

AI訓練的大量資料(語言、影像、社交網絡)不再是平坦的歐氏空間結構,而是存在於高維、非線性、層級結構中:

 

  • 知識圖譜:呈現樹狀與階層結構
  • 語言語義空間:具有語境與多重解釋
  • 社群網路:強烈群聚效應與中心化拓撲

 

這些資料的特徵讓「嵌入空間」若採傳統歐氏幾何會造成資訊壓縮與維度災難。因此,近年非歐幾何嵌入方法蓬勃發展,成為AI演算法的突破口。


2. 龐加萊嵌入(Poincaré Embedding):樹狀結構學習的利器

 

由Facebook AI Research (FAIR) 提出,Poincaré Embedding 將階層資料嵌入在負曲率的雙曲空間中,相較於歐氏嵌入,其能以更低維度、更精確表現結構關係。

 

📌 應用案例:

 

  • WordNet語意網嵌入:改用龐加萊模型後,大幅減少維度,提升語意層級關聯的表現
  • 知識圖譜嵌入:如TransH、HyperE,改善了父子節點與祖孫關係的語意投影


3. Hyperbolic Neural Networks(雙曲神經網路)

 

近年研究者開發出可在雙曲空間運算的神經網路,如Hyperbolic Neural Networks (HNNs),突破了傳統MLP和CNN在階層資料上的表現限制。

 

特色包括:

 

  • 非線性激活函數的雙曲變形
  • 在曲率空間中進行反向傳播
  • 低維表示、高保真解釋性

 

例如,Hyperbolic Graph Convolutional Networks(HGCN)被證明在知識圖譜與推薦系統中的表現超越傳統GCN。


4. Spherical Neural Networks(球面神經網路)

 

在視覺處理與天文資料分析中,球面幾何同樣被應用:

 

  • Spherical CNNs:對360度影像、天球影像進行對稱不變特徵學習
  • Cosine類似度模型:其背後幾何邏輯來自球面上角度相似性

 

例如,Google DeepMind在天文影像資料中就使用球面卷積網路進行星體檢測與分類。


5. 幾何深度學習(Geometric Deep Learning)全貌與展望

 

非歐幾何應用並不限於神經網路嵌入,還延伸到整個幾何深度學習的領域,包含:

 

  • 圖卷積網路(GCN):適用於任意拓撲
  • 流形學習(Manifold Learning):透過非線性映射保持結構
  • 黎曼幾何機器學習:在彎曲空間進行最短路徑優化與分類

 

未來,AI將朝向具備「幾何直覺」的智慧系統發展,能自動辨識資料分佈空間並選擇最佳嵌入幾何。

 


四、從廣義相對論到生成式AI:幾何的未來價值

 

    愛因斯坦的廣義相對論已證明,物理空間不是平坦的,而是彎曲的。非歐幾何為現代物理與宇宙學提供了語言。而在AI領域,非歐幾何則扮演「資料語境」的空間容器,幫助演算法更忠實表達多層級關係與語意彈性。

 

生成式AI(如Diffusion Models, GANs)也開始在潛空間學習中引入幾何規則,以減少模糊生成與語意崩壞的情況。


結語:第五公設的反叛,引領AI幾何革命

 

    非歐幾何從數學邊陲走入科技核心,它推翻了對「空間」的單一想像,也為AI在結構化資料與高維空間的運算創造新維度。正如第五公設的質疑帶來了一整個新世界,非歐幾何也正為未來AI建構更智慧、更理解語境的模型鋪路。