10月24日,在第七屆世界聲博會暨2024年科大訊飛全球1024開發者節上,科大訊飛宣布訊飛星火4.0Turbo全新升級??拼笥嶏w稱:星火4.0Turbo文本生成、語言理解、知識問答、邏輯推理、數學、代碼、多模態七大能力全面超過GPT-4 Turbo,數學能力、代碼能力超過GPT-4o,星火4.0Turbo效率提升50%。值得注意的是,在數學能力上,訊飛星火已完成超長思維鏈、樹搜索和自我反思評價等算法驗證,預計今年底可實現“類o1”(高難度數學能力顯著提升)。
星火4.0 Turbo發布,數學能力、代碼能力超過GPT-4o
訊飛星火大模型4.0 Turbo正式發布,在數學能力、代碼能力上超過了GPT-4o。由艾倫人工智能研究所、OpenAI等國內外權威單位發布,涵蓋理解和推理、綜合考試、數學和科學、代碼等不同任務類型的14項主流測試集中,訊飛星火4.0-Turbo在其中9項測試集中實現超越,星火4.0 Turbo效率相對提升50%。
根據行業實用數學任務構建的測試集CAppliedMath-1.0,訊飛星火4.0 Turbo在計算、財務、金融、度量等多個維度的任務中均超過GPT-4o水平,已完成超長思維鏈、樹搜索和自我反思評價等算法驗證,預計今年底可實現類“o1”的高難度數學能力顯著提升。
根據代碼生成HumanEval測試集上的效果對比,訊飛星火4.0 Turbo在Python、Java、JavaScript等任務上和GPT-4o的差距微弱,在C++能力上超過GPT-4o。
在真實應用場景,基于認知智能全國重點實驗室構建的iFLYCode-Eval-2.0代碼實用場景測試集,訊飛星火4.0 Turbo在代碼生成、代碼檢錯、單元測試等任務上都超過了GPT-4o。同時推出星火代碼7B版本,滿足代碼生成、代碼補全等極速響應型任務。
與華為合作,打造“飛星二號”大規模智算平臺
近兩年來,以ChatGPT為代表的生成式AI掀起新一輪產業浪潮,科大訊飛基于已有的技術積淀和成建制的研發團隊,迅速跟進大模型研發。2023年5月6日,公司首發星火認知大模型,此前已更新至4.0版本。
2023年上半年,科大訊飛與華為組建聯合特戰隊,就大模型底座能力進行高強度的攻關訓練,并在半年內實現星火大模型訓練和推理效率翻番。
2023年10月24日,二者聯合打造的基于昇騰生態的自主可控大模型算力底座“飛星一號”正式發布。據悉,這是首個支持萬億參數大模型訓練的萬卡國產算力平臺。
基于“飛星一號”,科大訊飛在2024年已對星火大模型進行了兩次迭代,分別在2024年1月30日、6月27日相繼發布了V3.5、V4.0,其中訊飛星火V4.0全面對標GPT-4 Turbo,并實現在文本生成、語言理解、知識問答、邏輯推理、數學能力等方面的整體超越。
記者從發布會獲悉,科大訊飛、華為、合肥市大數據資產運營有限公司三方聯合打造的國產超大規模智算平臺“飛星二號”正式啟動。
據悉,“飛星二號”將帶來新模型新算法的持續適配和智算集群規模的再次躍遷,持續探索無人區、引領國產大模型底座的發展、給世界提供第二選擇?!爸挥性谡嬲灾骺煽氐钠脚_上,才有真正的中國人工智能大未來?!笨拼笥嶏w董事長劉慶峰表示。
(安徽商報融媒體記者 梁?。?br>