在科技界的瞩目下,亚马逊于近日在其年度re:invent大会上揭晓了其在生成式人工智能领域的最新力作。会上,亚马逊现任首席执行官安迪·贾西亲自站台,向全球宣布了亚马逊新一代基础模型——Amazon Nova系列的问世。
自去年亚马逊推出其首款大模型Titan以来,业界便对其后续动作充满期待。与Titan相比,Nova系列无疑是一次更为全面和深入的探索。Titan作为一款单一模态的语言模型,仅仅是个开端,而Nova系列则主打Any to Any的概念,即任意模态输入、任意模态输出,这标志着亚马逊在生成式AI领域迈出了重要一步。
贾西在会上透露,Nova系列共包含六种大模型,其中四种专注于文本生成,而另外两种则致力于图像和视频内容的生成。这些模型不仅在性能上达到了业界领先水平,在成本效益和响应速度上也同样表现出色。
以Nova Micro为例,这款模型以极快的响应速度和超高的性价比赢得了内部开发者的青睐。在多个Benchmark测试中,Nova Micro的表现甚至优于meta的LLaMa 3.1 8B和Google的Gemini 1.5 Flash-8B。Nova Lite、Pro和Premier等模型也各自在不同的应用场景中展现出了卓越的性能。
Nova Premier作为系列中的顶级产品,被设计为复杂推理任务的首选模型,同时也是定制模型蒸馏的理想“教师”。尽管贾西没有直接对比其与其他顶级模型的表现,但从其定位来看,无疑是对标了OpenAI的Orion系列。
除了性能上的优势,Nova系列还注重与亚马逊云科技(AWS)的深度融合。这些模型已经全面集成在Amazon Bedrock中,并与Bedrock的所有功能进行了深度整合。这意味着开发者可以轻松地对模型进行微调、增强或蒸馏,以满足各种应用场景的需求。
在图像和视频生成方面,Amazon Nova Canvas和Nova Reel同样引人注目。Canvas可以根据文本或图像提示生成专业级的图像,而Reel则能够通过文本和图像轻松创建高质量视频。这两款模型不仅在内部测试中表现优异,在第三方的人类对比评估中也同样获得了高度评价。
贾西还透露了Nova系列的未来规划。他表示,亚马逊将在明年推出第二代Nova模型,并计划在第一季度推出一个语音到语音的模型,以及年中推出一个真正的多模态输入到多模态输出的模型。这将为用户提供前所未有的灵活性和多样性。
在发布新模型的同时,贾西还分享了亚马逊内部在AI应用方面的成功案例。作为全球最大的电商平台和AWS的“第一客户”,亚马逊在过去一年中尝试将AI应用于多个业务领域,包括零售业务的推荐系统、履约中心的路径规划、Prime Air无人机的送货服务以及Amazon Go商店的Just Walk Out技术等。
贾西指出,这些AI应用不仅提高了效率和降低了成本,还为用户带来了全新的体验。例如,在客户服务方面,亚马逊利用生成式AI重构了聊天机器人系统,使客户满意度提升了500个基点。在库存管理方面,一个基于Transformer模型的长期需求预测系统已经将预测准确性提高了10%,为亚马逊节省了数十亿美元的成本。
亚马逊还在探索AI在创新客户体验方面的潜力。例如,Rufus购物智能体能够为用户提供类似真人导购的体验;Alexa则正在通过多个基础模型的重构来更好地理解并预测用户需求;而Amazon Lens则能够通过照片搜索功能帮助用户轻松找到心仪的商品。
贾西表示,亚马逊内部已经构建或正在构建近1000个生成式AI应用程序,这些应用正在不断推动亚马逊向更高效、更智能、更个性化的方向发展。