社交媒体巨头meta正加速推进其人工智能语音功能的研发进程,据内部消息透露,公司计划在不久的将来推出最新的开源大语言模型——Llama 4,并将语音交互功能置于其核心位置。
meta的这一举动,旨在通过AI技术推动商业化进程,据可靠信息,meta期望在2025年实现AI产品的重要突破。meta首席执行官马克·扎克伯格曾多次公开表示,他的目标是使meta成为AI领域的领航者,并希望通过AI技术开辟新的收入增长渠道。
与传统的问答模式不同,meta的语音功能开发聚焦于实现更自然的双向对话体验。用户可以在对话中自由打断,这种灵活性将极大地提升用户与AI交互的流畅度和自然度。扎克伯格曾透露,他计划打造一个具备中级工程师编程和解决问题能力的人工智能工程代理,并认为这拥有巨大的市场潜力。
为了实现这一目标,meta正在积极探索多种商业化路径。据消息人士透露,公司正在考虑推出针对其AI助手meta AI的高级订阅服务,该服务将涵盖诸如餐厅预订和视频创作等代理任务。meta还在研究在其AI助手的搜索结果中引入付费广告或赞助帖子的可能性,以进一步挖掘商业价值。
meta的产品负责人克里斯·考克斯在近期的一次会议上强调,Llama 4将是一个功能全面的模型,语音交互将被设计为其原生功能,而非简单的语音转文本处理。这一设计将极大地提升语音交互的效率和用户体验。
随着竞争对手如OpenAI和xAI不断推出新的AI产品,meta在技术与伦理之间寻找平衡点的讨论也日益激烈。据知情人士透露,meta正在深入探讨Llama模型在输出内容方面的限制设置问题,以及是否需要适当放宽这些限制。
值得注意的是,meta的语音交互功能也是其Ray Ban智能眼镜的核心卖点之一。这款产品在市场上取得了显著的成功,进一步坚定了meta加速开发轻量级头戴设备,以期取代智能手机成为消费者主要计算设备的决心。