人工智能(AI)的發展正以驚人速度向前推進。近期,全球多家公司推出的最新大模型讓人目不暇接,特別是GPT-4o等產品備受關注。接下來全球這一領域競爭的焦點在哪里?各國人工智能發展將面臨哪些挑戰?
多模態成為競爭新焦點
上月,美國開放人工智能研究中心(OpenAI)發布了最新多模態大模型GPT-4o,它對語音的理解能力有了質的飛躍,同時還可分析圖像、視頻,并識別用戶情緒;緊隨其后,谷歌發布了多模態AI助手Project Astra。業內人士認為,這兩大產品背后的多模態融合技術,是人工智能競爭的新焦點,多模態、更自然的交互體驗成為大模型技術產品化并為更多人所接受的關鍵。
上海Soul人工智能研究院院長陶明日前在對記者談到GPT-4o發布時說:“不再大談深奧的技術、不再強調未來投入多少巨資,而是重點展示了家教輔導等應用場景,從中可以看出,此輪AI發展中,關注場景和交互體驗將會是必然的趨勢?!?/span>
中國多家科技企業近期也相繼發布新產品。字節跳動公司發布了豆包大模型家族,同樣具有多模態能力,可適用于多種場景;騰訊發布基于混元大模型的創作與分發平臺騰訊元器,方便用戶開發具備聊天對話、內容創作、圖像生成等多功能的智能體;大模型公司零一萬物推出的千億參數Yi-Large閉源模型正式亮相,據美國斯坦福大學最新大模型排行榜評估,其英語回復能力相關指標在全球處于領先地位。
零一萬物首席執行官李開復日前接受采訪時表示,多家中國科技公司在開源和閉源領域都發布了大量高質量的模型,性能逐步追齊GPT-4,并在中文能力上達到世界領先。
需要關注場景和應用
斯坦福大學今年4月發布的人工智能指數報告稱,2023年,著名人工智能模型中有61個源自美國,中國則有15個。業內人士指出,中美是全球人工智能發展的“領頭羊”,展現出了不同的發展趨勢和戰略重點。美國在高端芯片制造、基礎研究和技術創新上優勢明顯;而中國擁有龐大的互聯網用戶基數,提供了豐富的場景等方面數據資源,這對于訓練大模型來說是重要優勢。
“大模型的競賽可以分為幾個階段,第一個階段是‘卷指標’,在參數和指標的提升中重點關注性能問題,但這也造成了目前的一個行業通病問題——大模型性能和應用嚴重分離,也就是大家所討論的‘拿著錘子找釘子’的問題。因此,發展至第二個階段‘卷場景和體驗’,成為一種必然。”陶明說。
上海市數據科學重點實驗室主任肖仰華在接受新華社記者采訪時指出,應該看到這一輪競爭中應用場景的重要性。中國企業可以先從應用層面切入,反哺和推動基礎模型性能提升。
在談到數據問題時,肖仰華說,GPT等大模型仍然是主要基于互聯網通用開放語料進行訓練。這類通用大模型一旦用于千行百業,可能存在領域知識匱乏的根本性問題,從而限制了大模型在具體領域的價值發揮。
零一萬物公司模型訓練負責人黃文灝表示,他看到GPT-4o更新了分詞器的詞表,但其中和中文相關的詞元質量還是沒跟上。他認為這可能是由于他們缺乏高質量的中文語料,這對中國企業是一個機會。“國內的工程師可以更沉下心來對數據進行研究、分析,將數據質量做到非常高的水平?!?/span>
面臨能源、安全等諸多挑戰
能源成為人工智能發展中的重要問題。有研究顯示,ChatGPT每日約消耗超過50萬度電,相當于一個美國家庭每天平均用電量的1.7萬倍。美國“元”公司首席執行官扎克伯格、OpenAI首席執行官奧爾特曼等人今年在不同場合都強調了能源在人工智能下一步發展中的關鍵作用。微軟、OpenAI、谷歌、亞馬遜等企業紛紛通過直接入股核電或向核電公司購買電力等方式,加強能源供應。
中國云基礎設施服務提供商中聯數據集團副總裁馬超日前接受新華社記者采訪時也表示,算力和大數據產業對能源的需求快速增加,產業競爭日益重視能源。
倫理相關問題也一直是公眾不安全感的來源。GPT-4o使用了高度類似好萊塢女星斯嘉麗·約翰遜聲音的語音,但未獲她授權。對此約翰遜發文表示:“在這個我們都在努力應對深度偽造,保護自身形象、作品和身份的時代,我期待通過透明度和立法來解決這些問題,確保個人權利得到保護?!?/span>
此外有不少人擔憂,人工智能發展過速可能會對人類構成威脅。去年底,首屆全球人工智能安全峰會在英國召開。美國、英國、歐盟、中國等多方代表就人工智能技術帶來的風險與機遇展開討論,推動形成具有廣泛共識的人工智能治理框架。
此前,在去年10月,中方提出《全球人工智能治理倡議》,主張人工智能治理應確保有益、確保安全、確保公平。