亞馬遜在2024年AWS re:Invent全球大會上,宣布推出新一代基礎模型Amazon Nova,這些模型在多種任務上展現出頂尖智慧,且具備業界領先的性價比。Amazon Nova模型將在Amazon Bedrock中提供,包括超快速文本生成模型Amazon Nova Micro,以及能夠處理文本、圖像和影片並生成文本的多模態模型Amazon Nova Lite、Amazon Nova Pro和Amazon Nova Premier。此外,亞馬遜還推出了兩個全新模型——用於生成高品質圖像的Amazon Nova Canvas和用於生成高品質影片的Amazon Nova Reel。
Amazon Nova理解模型展現出卓越的智慧、能力與速度 Amazon Nova包含四款先進的模型。Amazon Nova Micro是一款僅處理文本的模型,能夠以極低的延遲和成本提供回應;Amazon Nova Lite是一款極具成本效益的多模態模型,能夠快速處理圖像、影片和文本輸入;Amazon Nova Pro是一款功能強大的多模態模型,可在準確性、速度和成本之間實現絕佳平衡,適合多種任務;Amazon Nova Premier是亞馬遜的頂級多模態模型,專為複雜推論任務而生,並將其作為蒸餾客製化模型(distilling custom models)的最佳典範模型(teacher model)使用。目前,Amazon Nova Micro、Amazon Nova Lite和Amazon Nova Pro已全部正式可用,Amazon Nova Premier預計將在2025年第一季度可用。
亞馬遜對Amazon Nova模型進行了廣泛的業界基準測試。結果表明,Amazon Nova Micro、Amazon Nova Lite和Amazon Nova Pro在各自類別中與最佳模型相比均表現得相當有競爭力。
Amazon Nova Micro在11項適用基準測試中,其表現與Meta的LLaMa 3.1 8B相當或更優,而在12項適用基準測試中,其表現也與Google Gemini 1.5 Flash-8B持平或更優。憑藉每秒210個輸出token的業界領先速度,Amazon Nova Micro非常適合需要快速回應的應用場景。
Amazon Nova Lite在同類模型中同樣具備強勁競爭力。與OpenAI的GPT-4o mini相比,它在19項基準測試中有17項表現持平或更優;與Google的Gemini 1.5 Flash-8B相比,在21項基準測試中也有17項表現相當或更優;與Anthropic的Claude Haiku 3.5相比,則在12項基準測試中有10項表現相當或更優。除了在文本基準測試中展現出色的準確性外,Amazon Nova Lite在影片、圖表和文檔理解方面也表現突出,這一點透過VATEX、ChartQA和DocVQA等基準測試得到了證明。此外,Amazon Nova Lite在代理工作流程上也表現優異,如在Berkeley Function Calling Leaderboard上的函式呼叫能力,以及在理解視覺元素以在瀏覽器和電腦螢幕上執行操作的核心能力方面表現出色,這一點在VisualWebBench(網頁瀏覽器操作基準測試)和Mind2Web(通用多模態代理基準測試)得到證明。
Amazon Nova Pro在與OpenAI的GPT-4o的20項基準測試中,有17項表現相當或更優;在與Google的Gemini 1.5 Pro的21項基準測試中,有16項表現持平或更優;在與Anthropic的Claude Sonnet 3.5v2的20項基準測試中,有9項表現相當或更優。除了在文本和視覺智慧基準測試中的準確性外,Amazon Nova Pro在遵循指令和多模態代理工作流程方面也表現出色,相關測試包括綜合RAG(Comprehensive RAG Benchmark)、Berkeley Function Calling Leaderboard和Mind2Web。
多語言和多模態支援,具備長上下文處理能力 Amazon Nova Micro、Lite和Pro支援200多種語言。Amazon Nova Micro支援128K輸入token的上下文長度,而Amazon Nova Lite和Pro的上下文長度可達300K token,處理影片時長可達30分鐘。到2025年初,亞馬遜將支援超過200萬輸入token的上下文長度。
快速且具有成本效益 Amazon Nova模型快速、具有成本效益,且設計上易於與客戶的系統和資料無縫整合。Amazon Nova Micro、Lite和Pro在各自的智慧類別中,成本比Amazon Bedrock中表現最佳的模型至少便宜75%,同時也是Amazon Bedrock中對應類別速度最快的模型。
借助Nova創意內容生成模型,取得生產級視覺內容 Amazon Nova Canvas是一款先進的圖像生成模型,能夠根據輸入的文本或圖像生成專業級的視覺內容。它提供了便捷的編輯功能,使用者可以透過文本輕鬆調整圖像,控制顏色組合和佈局。該模型內建的安全控制措施確保安全和負責任地使用AI,包括浮水印功能,能夠追溯每張圖像的來源;以及內容審核功能,限制可能產生的有害內容。根據合作廠商的對比評估,Amazon Nova Canvas在效能上優於OpenAI的DALL-E 3和Stable Diffusion,並在關鍵的自動化指標上表現出色。
Amazon Nova Reel是一款先進的影片生成模型,能夠幫助客戶輕鬆以文本和圖像打造高品質影片,適用於廣告、行銷和培訓等內容創作。客戶可以使用自然語言提示控制視覺風格和節奏,包括鏡頭移動、旋轉和縮放。根據合作廠商的評估,Amazon Nova Reel在品質和一致性上優於同類模型,客戶更傾向於選擇由其生成的影片,而非Runway的Gen-3 Alpha生成的影片。與Amazon Nova Canvas一樣,Amazon Nova Reel也具備內建的安全控制措施,包括浮水印和內容審核。目前,Amazon Nova Reel支援生成六秒的影片,未來幾個月將支援最長為兩分鐘的影片生成。