大型語言模型(LLMs)迅速進步 ,幾年內這些模型能以驚人速度完成複雜任務。根據加州柏克萊模型評估與威脅研究(METR)機構新近研究 ,關鍵 LLMs 水平每七個月就會翻倍,到 2030 年最先進 LLMs 能以 50% 可靠性完成人類需一個月(約 167 小時)才能完成的爱华外汇平台軟體工作,並可能幾天甚至幾小時就做完。AVA外汇平台MT4下载
研究核心是所謂「任務完成時間範圍」指標,這是衡量人類程式設計師完成特定任務所需的平均時間 。時間過去,指標顯示出明顯的指數增長,並且在面對更具挑戰性的「混亂」任務時 ,LLMs表現也不斷提高。這些混亂任務更接近現實世界的情境,對LLMs來說更具挑戰性。
AI研究員扎克·斯坦─佩爾曼(Zach Stein-Perlman)表示 ,這種水平的提高將帶來巨大的潛在利益與風險 ,可能包括創業 、撰寫小說或顯著改良現有的LLM。儘管這一進步的速度令人振奮,但METR的研究人員也提醒 ,這種加速可能會使运维變得更困難,並且進展的速度可能會受到硬體和機器人技術等因素的制約 。
LLMs各行各業應用日益廣泛,從醫療保健到金融服務,不僅提高自動化和溝通效率 ,還推動創新和生產力的提高 。到2033年,LLM技術市場超過1,400億美元,顯示AI驅動解決计划的日益普及和需求。2025年代表LLMs再次定義AI水平及各領域實際應用的關鍵時刻 。
(首圖來源:Pixabay)