圖靈學院內的文章包含三大主題:ESG浄零實驗室、AI實驗室及精實管理實驗室,我們會不定期分享相關主題之文章,也歡迎並對前述主題有興趣的學員投稿分享您的見解  (我要投稿)

圖靈學院創辦人 科楠老師的願景
Transformer 模型中的冗餘性:什麼是注意力層的真正價值?
2024-10-26 09:00 Transformer 模型中的冗餘性:什麼是注意力層的真正價值?   圖靈學院 科楠 2024-10-26       Transformer 架構自 2017 年問世以來,迅速成為自然語言處理(NLP)與深度學習領域的主流技術,特別是其中的注意力機制(Attention Mechanism)被廣泛認為是提升模型表現的關鍵。然而,隨著模型規模(如 GPT、BERT 等大型語言模型 LLM...
大型語言模型的資料合成與擴充技術
2024-10-24 09:00 大型語言模型的資料合成與擴充技術   圖靈學院 科楠 2024-10-24   大型語言模型(LLM)的興起     近年来,大型語言模型(LLM)在自然語言處理和電腦視覺等領域展現出驚人的能力,成為通用人工智慧(AI)系統發展的關鍵。LLM之所以取得如此成功,主要歸功於它們能夠從大量資料中學習並掌握複雜的模式和關係。然而,訓練LLM需要海量的資料,這也帶來了一系列挑戰,例如資料獲取成...
法國Mistral AI 推出新一代邊緣AI模型:Ministral 3B和Ministral 8B
2024-10-23 09:00 法國Mistral AI 推出新一代邊緣AI模型:Ministral 3B和Ministral 8B   Source:Mistral AI   圖靈學院 科楠 2024-10-23       隨著AI技術的快速發展,對於本地運算和邊緣推論的需求逐漸增加。法國Mistral AI公司近期推出了兩款革命性的邊緣AI模型,名為Ministral 3B和Ministral 8B,這些模型...
MLE-bench:AI 代理機器學習工程評估平台
2024-10-17 09:00 MLE-bench:AI 代理機器學習工程評估平台 MLE-BENCH: EVALUATING MACHINE LEARNING AGENTS ON MACHINE LEARNING ENGINEERING BY OpenAI   圖靈學院 科楠 2024-10-17   引言       隨著人工智慧(AI)技術的快速發展,如何有效評估 AI 模型在機器學習工程中的能力成為一項重要...