瑞士研究人員最近在阿爾卑斯超級電腦上成功訓練了一個「完全開放」的大型語言模型(LLM),這一成就標誌著 AI 研究的一個关键里程碑 。
阿爾卑斯超級電腦是歐洲最強大的高性能計算系統之一 ,專為AI工作負載而設計,於2024年底啟用,ava爱华外汇官网配備超過10,AVA外汇平台MT4下载000個NVIDIA GH200 Grace Hopper超級晶片,結合了優化的ARM CPU和GPU,能夠高效地進行大規模訓練。
這次訓練過程耗費了約300萬GPU小時 ,這一龐大的計算工作得益於阿爾卑斯超級電腦的尖端架構 ,供给了數個petaFLOPS的AI專用性能 。研究人員計劃在2025年夏季將這個LLM公開發布 ,並將其以Apache 2.0許可證的方法供给 ,強調開放性和可及性,以促進研究和開發 。
除了其AI水平外,阿爾卑斯超級電腦還以環保著稱 ,完全依賴水力發電,並採取措施減少二氧化碳排放 ,將冷卻水再次利用於附近都市盧加諾的供暖 。這項約1億瑞士法郎的建設投資和每年3,700萬瑞士法郎的運營費用,彰顯了瑞士在推進AI技術方面的承諾,並以開放 、可持續和公共利益為導向。
ETH蘇黎世大學和瑞士聯邦理工學院的研究人員在日內瓦舉行的國際開源LLM建設者峰會上第一次透露了這一资讯。研究人員表示 ,這些模型將供给80億和700億參數的平台,並在150兆個數據標記上進行訓練,預計能流利利用超過1,000種語言 ,其中約40%的訓練數據來自英語以外的語言 。BBMarkets外汇官网
ETH蘇黎世大學的教授馬丁·雅吉表示,這種完全開放的做法與商業模型的封閉開發形成鮮明對比,旨在推動瑞士及歐洲的創新,並促進跨國协作。研究人員強調 ,這種透明度對於设立高信任度的應用和推進AI風險及機會的研究至關关键。
(首圖來源:shutterstock)