Finews
台灣最好懂得財經、科技新聞網!
帶給你最有用的新聞資訊。
Finews
台灣最好懂得財經、科技新聞網!
帶給你最有用的新聞資訊。
阿里巴巴在生成式AI領域持續進化,推出Qwen2.5和Wan2.1,提升多模態能力並推動影片生成技術,迎戰激烈的市場競爭。
你是否感覺到,最近「人工智慧」(AI)這個詞彙,特別是「生成式 AI」(Generative AI),常常出現在我們眼前?從文字、圖片到影片,AI 正快速改變我們的工作與生活方式。而身為科技與財經領域的重要參與者,中國的阿里巴巴集團在這場 AI 競賽中,扮演著什麼角色?他們推出了哪些最新的 AI 模型?這些模型有哪些特色?在全球 AI 競爭白熱化的今天,阿里巴巴又面臨著哪些挑戰與機會?今天,我們就一起深入探索阿里巴巴在生成式 AI 領域的最新動態,以及這個快速變化的市場格局。
首先,讓我們來看看阿里巴巴在基礎AI模型上的重要進展。阿里巴巴最近發布了其千問系列AI模型的最新版本:Qwen 2.5。你知道嗎?基礎的 AI 模型就像是 AI 的大腦,它決定了 AI 能理解和生成哪些內容。而 Qwen 2.5 在這個「大腦」上進行了全面的升級。
Qwen 2.5 強調在多個評測基準上都展現了顯著的性能提升,這代表它在理解複雜指令、生成準確回答、進行推理等方面變得更強了。想像一下,如果你需要 AI 幫你整理一份報告、撰寫一封郵件,或者甚至幫你寫一段程式碼,Qwen 2.5 的能力會讓你事半功倍。而且,這個新模型在數據處理能力上也做了優化,能更有效率地處理大量的資訊。
更值得注意的是,Qwen 2.5 具備了更強大的多模態處理能力。什麼是「多模態」呢?簡單來說,就是 AI 不再只會處理單一類型的資訊,例如文字。它可以同時理解和生成不同形式的資訊,比如文字和圖像。這意味著你可以給 Qwen 2.5 一張圖片,然後問它圖片裡有什麼,或者讓它根據圖片生成一段描述文字,甚至是根據你的文字指令修改圖片內容。這種能力對於許多商業應用來說非常關鍵,比如在電子商務領域,AI 可以分析商品圖片並生成詳細的商品描述;在媒體產業,AI 可以輔助內容創作;在行銷領域,AI 可以生成吸引人的圖文廣告。這些強大的能力,也直接整合到了阿里云的平台中,讓企業用戶更容易地使用這些先進的 AI 技術來解決實際問題,推動企業應用的創新。
另外,我們可以看到 Qwen 2.5 主要功能的比較,如下表:
功能 | 描述 |
---|---|
性能提升 | 在多個評測基準上展現顯著性能提升,特別是處理複雜指令。 |
數據處理能力 | 優化過的能力使其可以更有效率地處理大量資訊。 |
多模態處理 | 能同時理解與生成文字、圖像等多種形式的資訊。 |
除了文字與圖像,影片內容在今天也變得越來越重要。阿里巴巴沒有缺席這個領域,他們也推出了一款AI影片生成工具,叫做 Wan 2.1。想像一下,未來你可能不需要複雜的剪輯軟體和專業的技巧,就能通過 AI 創作出精彩的影片內容。Wan 2.1 的目標就是讓這件事變得更簡單。
Wan 2.1 不只支援基本的「文字轉影片」,還可以做到「圖像轉影片」,甚至能進行一些基礎的影片編輯。這款工具的底層採用了先進的技術架構,特別強調了影片的時間一致性和視覺品質。這是什麼意思呢?在早期的 AI 生成影片中,常常會出現畫面不連貫、人物或物體在不同幀之間變形的問題,看起來很不自然。Wan 2.1 努力克服了這些挑戰,讓生成的影片看起來更流暢、更真實。
更有趣的是,Wan 2.1 走的是開源路線,而且強調支援消費級硬體。這與一些需要頂級專業設備或僅提供雲端服務的工具不同。開源意味著任何人都可以查看它的程式碼,甚至在此基礎上進行開發和改進,這有助於建立一個活躍的開發者社群。支援消費級硬體則大幅降低了普通用戶或小型團隊使用專業級 AI 影片生成工具的門檻。這項策略有望像許多成功的開源專案一樣,快速推動 AI 影片生成技術的普及和應用,催生大量的內容創作者和創新的應用場景,對未來的內容產業產生潛在的產業變革影響。
當然,在 AI 影片生成領域,阿里巴巴並不是唯一一個玩家。國際上還有像 OpenAI 的 Sora、Google 的 Veo 2 等備受關注的競爭對手。Wan 2.1 以其開源和支援消費級硬體的特點,試圖在這個競爭激烈的市場中找到自己的定位,並與這些巨頭一較高下。
當我們把視線從阿里巴巴拉開,看看更廣闊的中國 AI 市場,你會發現這裡的競爭同樣異常激烈。阿里巴巴有 Qwen,百度則有其強大的 ERNIE 模型系列。百度最近也發布了新的模型,例如 ERNIE 4.5 Turbo 和 ERNIE X1 Turbo,同樣強調多模態能力、強大的推理能力和一個非常關鍵的因素——低成本。
百度公司 CEO 李彥宏曾公開表示,未來的 AI 競爭,關鍵不在於基礎的模型本身,也不完全在於 AI 所需的晶片,最終的勝負手將在於「應用」。這反映了中國 AI 市場的一個重要趨勢:技術最終要落地,要能夠解決實際問題,而且要「用得起」。百度通過大幅降低部分模型的價格,意圖降低開發者和企業使用 AI 的門檻,加速 AI 應用的應用落地,並積極推動其「AI 開放計畫」和標準,努力建立龐大的開發者生態。
此外,還有其他新興的 AI 企業,如 DeepSeek AI,其推出了行情極具競爭力的模型。在市場競爭中,企業的成本與性能成為左右策略的重要因素。以下表格總結了主要競爭者及其優勢:
公司 | 優勢 | 挑戰 |
---|---|---|
阿里巴巴 | Qwen 2.5的多模態能力 | 來自其他競爭者的壓力 |
百度 | 低成本與強大推理能力 | 如何保持市場份額 |
DeepSeek AI | 成本優勢,性能表現良好 | 可持續增長的策略 |
這些新進者的技術發展,也從側面反映了在全球技術管制(特別是美國對中國先進晶片的限制)的背景下,中國的 AI 產業正在探索多條不同的技術路徑,試圖繞過限制,實現自主發展。這也讓整個市場競爭變得更加多元和複雜。
生成式 AI 的發展,不僅僅是技術層面的競爭,它還深刻地受到宏觀環境的影響,包括國際政治、政策法規,甚至是新興技術趨勢。
首先,你可能已經聽說過,美國一直在對中國實施嚴格的技術出口管制,特別是在高性能計算晶片方面。這些管制確實對中國 AI 企業獲取頂級算力造成了壓力。然而,正如前面提到的,中國企業正在通過優化算法、探索新的技術架構、發展本土晶片產業等方式來應對挑戰。阿里巴巴和百度的新模型能在一定程度上取得進展,顯示出在管制下,產業仍在尋找發展的突破口。
其次,AI 模型之間的競爭也帶來了關於知識產權和技術來源的爭議。例如,OpenAI 曾公開表示擔憂,一些競爭對手可能正在使用其模型的輸出結果來訓練自己的模型,這種行為被稱為「知識蒸餾」。雖然這只是指控,但也反映出在 AI 技術快速迭代的同時,如何界定技術的邊界、保護研發成果,是未來需要解決的重要問題。如果這類爭議加劇,可能會導致更強的技術防護措施或法律行動,進而影響整個 AI 生態的開放性。
此部分的圖示展示了AI技術的發展背景及其影響:
此外,我們也看到一些有趣的跨領域合作正在發生。例如,有報導提到 Web3 AI 平台 Flock 正在與阿里云 Qwen 進行合作。這似乎有點出乎意料,對吧?Web3 強調去中心化、數據主權和透明性,而阿里云和 Qwen 代表的是相對中心化的 AI 巨頭。這種合作可能探索的是如何利用 Web3 的一些技術特性,比如去中心化的數據儲存或基於區塊鏈的隱私保護技術,來解決中心化 AI 在數據隱私或算力成本方面面臨的一些挑戰。例如,在聯邦學習(Federated Learning)等場景下,數據可以在不離開用戶設備的前提下被用於模型訓練,這對於處理敏感數據的企業應用(如金融、醫療)特別有價值。這類跨界合作,或許會為 AI 的未來發展開創新的應用場景和商業模式。
總體來看,AI 產業正處於一個風起雲湧的時代。技術在不斷進步,競爭在加劇,宏觀環境也在施加影響。理解這些不同的面向,才能更全面地把握 AI 發展的脈絡。
經過前面的探討,我們可以看到,阿里巴巴憑藉 Qwen 2.5 和 Wan 2.1 等最新AI模型,展現了其在基礎模型和特定應用領域的技術實力。Qwen 2.5 的強大多模態能力與阿里云的整合,將進一步賦能企業應用;而 Wan 2.1 的開源和支援消費級硬體策略,則有望推動 AI 影片生成的普及。
然而,這場競賽遠未結束。來自百度、DeepSeek 等國內競爭者的快速追趕,特別是在低成本和應用落地方面的努力,正在重塑市場格局,加速 AI 技術的平價化。同時,國際上的巨頭如 OpenAI 和 Google 也在不斷創新,保持領先地位。
此外,技術管制、知識產權爭議以及 Web3 AI 等新興力量的加入,都為這個市場增加了變數,但也可能催生新的合作模式和發展機會。未來的 AI 競爭,將是技術實力、成本效益、應用生態構建以及應對複雜宏觀環境的多維度較量。對於我們來說,持續關注這些進展,理解其背後的技術邏輯和商業策略,將幫助我們更好地應對 AI 時代帶來的挑戰與機遇。
【投資警語】本文僅為科技與產業趨勢分析,不構成任何投資建議。投資有風險,請務必審慎評估並諮詢專業意見。
Q:什麼是生成式 AI?
A:生成式 AI 是一種能夠創建內容的人工智慧技術,包括文字、圖像和音視頻。
Q:阿里巴巴的 Qwen 2.5 有什麼特點?
A:Qwen 2.5 具備多模態處理能力,能理解和生成文字及圖像,並展現顯著性能提升。
Q:AI 在不同產業的應用有哪些?
A:AI 可應用於電子商務、媒體創作、行銷廣告等多個行業,提升效率並創造新商業模式。