Articles in Turing Academy cover three major themes: ESG Net Zero Laboratory, AI Laboratory and Lean Management Laboratory. We will share articles on related topics from time to time. We also welcome students who are interested in the above topics to submit articles and share them with you. Insights (I want to contribute)

非歐幾何與第五公設的顛覆:從數學革命到AI演算法的突破應用

 

 

圖靈學院
科楠
2025-6-16

 

前言:一條不平行的路,開啟幾何新視野

 

    人類對空間與形狀的理解,數千年來建立在歐幾里得幾何的堅實基礎上。這種幾何邏輯幾乎是我們從小在課堂上所學的唯一模型,從直線、平行線到三角形的內角和等於180度,這一切看似理所當然。

 

事實上,一般人幾乎只知道這種平坦空間的幾何。我自己曾經好奇地問了一些大學電機系的朋友:「你們知道非歐幾何嗎?」結果得到的多半是尷尬的微笑和「好像在哪聽過,但不太確定是什麼」的回答。這也難怪,非歐幾何一直以來都像是數學世界中的隱藏分支,除非深入研究,否則往往與日常理解無緣。

 

那我為什麼要寫這篇來探討幾何學?因為在AI與神經網路的世界裡,幾何學早已不是抽象的數學思維遊戲,而是許多演算法架構背後的深層邏輯。你所認識的卷積神經網路(CNN)、圖神經網路(GNN)、甚至是語意嵌入(semantic embeddings),它們的運作都脫離不了一個核心問題:如何在高維甚至彎曲的空間中,有效表徵資料的幾何結構與關聯性。

 

因此,當第「五公設」被質疑,整個幾何宇宙便因此改變。非歐幾何(Non-Euclidean Geometry) 不只是數學的一場革命,更是現今 AI 與深度學習在高維空間中建模的關鍵理論基石。

本文將帶你深入探索非歐幾何與歐幾里得幾何的根本差異,並揭示它如何在卷積神經網路、圖神經網路與超球面學習等 AI 領域中,帶來突破性的應用。


一、歐幾里得幾何的第五公設:邏輯體系的破口

 

    歐幾里得幾何建構於《幾何原本》的五大公設之上,前四條簡單直觀,但第五條卻複雜又難以直觀理解:

 

「若一直線與兩直線相交,使同側內角和小於兩直角,則這兩直線在此側延伸將相交。」

 

這條被稱為「平行公設」的命題,本質上是對“唯一平行線”的斷言:給定一條直線與線外一點,僅存在唯一一條與該直線平行、不相交的直線通過此點。

 

問題在於,為何這條命題不能像其他四條一樣被證明?18至19世紀,許多數學家(包括高斯、羅巴切夫斯基、波耶-巴喬里)試圖以其他公設推導此命題,最終卻意外發現——當不採用第五公設時,仍可建構自洽的幾何系統,並誕生了兩種主要的非歐幾何:

 

  • 雙曲幾何(Hyperbolic Geometry)
  • 橢圓幾何(Elliptic Geometry)


二、非歐幾何的誕生:平行線不再唯一

 

雙曲幾何:多條平行,空間變曲

 

在雙曲幾何中,給定一條直線與其外一點,有無限多條不相交直線通過該點。這類幾何適用於負曲率空間,如龐加萊圓盤模型(Poincaré Disk Model)與龐加萊上半平面模型。

   


橢圓幾何:沒有平行線,三角形也「不守規矩」


在橢圓幾何(Elliptic Geometry)中,所有直線最終都會相交,換句話說——根本沒有平行線的存在。這聽起來或許難以想像,但我們日常生活中其實早就接觸過這樣的空間:地球表面就是一個典型的橢圓幾何範例。

 

想像你在地球上畫一個「三角形」,例如:

 

第一條邊沿著赤道向東走

 

第二條邊從某個點轉向北極

 

第三條邊從北極再回到起點

 

你會發現這個「三角形」的三個角加起來大於180度!這違背了我們在教科書中學到的「三角形內角和等於180度」的規則,因為這條規則只適用於平坦的歐幾里得幾何空間。


類似地,在雙曲幾何(例如龐加萊模型)中,三角形的內角和反而會小於180度。

 

✅ 用一句話總結:

 

在非歐幾何裡,空間彎曲會改變角度的總和與直線的命運。

 

這種幾何的特性不僅在天文學與廣義相對論中極為重要,當代AI演算法也借助這種空間來表示複雜的資料結構,如層級關係與語義網絡。


三、非歐幾何在神經網路的革命性應用

 

1. 高維資料的幾何需求:為何需要非歐幾何?

 

AI訓練的大量資料(語言、影像、社交網絡)不再是平坦的歐氏空間結構,而是存在於高維、非線性、層級結構中:

 

  • 知識圖譜:呈現樹狀與階層結構
  • 語言語義空間:具有語境與多重解釋
  • 社群網路:強烈群聚效應與中心化拓撲

 

這些資料的特徵讓「嵌入空間」若採傳統歐氏幾何會造成資訊壓縮與維度災難。因此,近年非歐幾何嵌入方法蓬勃發展,成為AI演算法的突破口。


2. 龐加萊嵌入(Poincaré Embedding):樹狀結構學習的利器

 

由Facebook AI Research (FAIR) 提出,Poincaré Embedding 將階層資料嵌入在負曲率的雙曲空間中,相較於歐氏嵌入,其能以更低維度、更精確表現結構關係。

 

📌 應用案例:

 

  • WordNet語意網嵌入:改用龐加萊模型後,大幅減少維度,提升語意層級關聯的表現
  • 知識圖譜嵌入:如TransH、HyperE,改善了父子節點與祖孫關係的語意投影


3. Hyperbolic Neural Networks(雙曲神經網路)

 

近年研究者開發出可在雙曲空間運算的神經網路,如Hyperbolic Neural Networks (HNNs),突破了傳統MLP和CNN在階層資料上的表現限制。

 

特色包括:

 

  • 非線性激活函數的雙曲變形
  • 在曲率空間中進行反向傳播
  • 低維表示、高保真解釋性

 

例如,Hyperbolic Graph Convolutional Networks(HGCN)被證明在知識圖譜與推薦系統中的表現超越傳統GCN。


4. Spherical Neural Networks(球面神經網路)

 

在視覺處理與天文資料分析中,球面幾何同樣被應用:

 

  • Spherical CNNs:對360度影像、天球影像進行對稱不變特徵學習
  • Cosine類似度模型:其背後幾何邏輯來自球面上角度相似性

 

例如,Google DeepMind在天文影像資料中就使用球面卷積網路進行星體檢測與分類。


5. 幾何深度學習(Geometric Deep Learning)全貌與展望

 

非歐幾何應用並不限於神經網路嵌入,還延伸到整個幾何深度學習的領域,包含:

 

  • 圖卷積網路(GCN):適用於任意拓撲
  • 流形學習(Manifold Learning):透過非線性映射保持結構
  • 黎曼幾何機器學習:在彎曲空間進行最短路徑優化與分類

 

未來,AI將朝向具備「幾何直覺」的智慧系統發展,能自動辨識資料分佈空間並選擇最佳嵌入幾何。

 


四、從廣義相對論到生成式AI:幾何的未來價值

 

    愛因斯坦的廣義相對論已證明,物理空間不是平坦的,而是彎曲的。非歐幾何為現代物理與宇宙學提供了語言。而在AI領域,非歐幾何則扮演「資料語境」的空間容器,幫助演算法更忠實表達多層級關係與語意彈性。

 

生成式AI(如Diffusion Models, GANs)也開始在潛空間學習中引入幾何規則,以減少模糊生成與語意崩壞的情況。


結語:第五公設的反叛,引領AI幾何革命

 

    非歐幾何從數學邊陲走入科技核心,它推翻了對「空間」的單一想像,也為AI在結構化資料與高維空間的運算創造新維度。正如第五公設的質疑帶來了一整個新世界,非歐幾何也正為未來AI建構更智慧、更理解語境的模型鋪路。