OpenAI近日宣布,其ChatGPT移动应用将新增一项高级功能——屏幕与实时视频共享,旨在提升用户聊天体验,让沟通更为直观与高效。这项功能的推出,意味着用户无需再通过上传照片或文字描述来分享所见所感,直接利用手机摄像头即可与ChatGPT进行视觉交流。
屏幕和视频共享功能在提升聊天便捷性的同时,也引发了对于个人隐私安全的关注。毕竟,这赋予了OpenAI更多访问用户敏感信息的权限。不过,OpenAI强调,他们将在保障用户隐私的前提下,提供这一创新服务。
据悉,用户只需在ChatGPT聊天栏中点击语音图标,即可进入高级语音模式,进而开启屏幕和视频共享功能。该功能原本计划在GPT-4o发布时同步推出,但当时仅提供了音频模式。如今,随着技术的不断成熟,用户终于能够利用手机摄像头与ChatGPT进行视觉互动,让AI模型“亲眼”见证用户的所见所闻。
在OpenAI的直播演示中,首席产品官Kevin Weil与团队成员展示了ChatGPT如何协助制作手冲咖啡。通过将手机摄像头对准咖啡机,ChatGPT不仅理解了咖啡机的操作原理,还成功指导团队完成了咖啡的冲泡过程。团队还演示了ChatGPT如何通过理解手机上的公开消息来支持屏幕共享功能,其中Weil佩戴圣诞老人胡须的画面更是增添了不少趣味性。
OpenAI表示,这项功能将率先在大多数国家向ChatGPT Plus、Pro以及Team用户开放。对于Enterprise和Edu用户而言,他们则将在明年1月开始体验这一新功能。欧盟、瑞士、冰岛、挪威和列支敦士登等地区的ChatGPT Plus和Pro用户也将很快迎来这一更新。
在OpenAI宣布这一消息之前,谷歌已经展示了其Astra项目的进展。Astra是一款实验性的人工智能助手,通过安卓应用程序或原型眼镜来记录人类所看到的世界。而谷歌新推出的Gemini 2.0则进一步升级了视觉和音频处理能力,并具备了更多代理功能,能够代表用户执行多步骤任务。目前,Gemini 2.0的代理功能以三个不同名称存在:通用AI助手项目Astra、特定AI任务项目Mariner以及开发人员项目Jules。