机器之心报道
在GPT-4o进iPhone之前,谷歌Gemini抢先了一步完成了手机版的落地。
周三凌晨,在人们期待OpenAI「草莓大模型」的时候,谷歌在MadebyGoogle活动上正式发布了GeminiLive,以及一系列Pixel硬件产品。
今天的活动,谷歌充满信心地进行了100%现场演示,虽然出现了一些小问题。
两次让手机识图(不过用的是三星),都失败了。
不过正如谷歌所说的,我们已经进入了「Gemini的时代」。
在Pixel9系列之后,今天发布的一系列GeminiAI功能也将随安卓15出现在各种Android手机上。
GeminiLive:对标GPT-4o,即刻上线
GeminiLive是谷歌针对OpenAI高级语音模式推出的一款产品,该功能与ChatGPT几乎完全相同,之前一直处于alpha测试阶段。
GeminiLive提供了一种移动对话体验,可以让用户和Gemini展开自由流畅的对话,甚至可以像在普通电话中一样打断或改变话题,而无需打字。
谷歌在博客中这样描述:你可以与GeminiLive(通过Geminiapp)交谈,并从10种新的自然声音中选择一种来回应,(而OpenAI仅提供3种声音)。你甚至可以按照自己的节奏说话,或者在回答过程中打断它并提出其他问题,就像在平时对话中一样。
GeminiLive是可以直接唤醒的,你可以在应用程序在后台运行或手机锁屏时继续与Gemini对话,且对话可以随时暂停和恢复。
GeminiLive还将与多种安卓应用的功能(如Keep)集成,从而提高Gemini的可用性。
今日起,谷歌开始在Android手机的GeminiAdvanced用户推出该功能,仅限英语,并将在未来几周内扩展到iOS和更多语言版本。
不过,在现场演示中,当现场人员问到演唱会海报的相关信息时,GeminiLive失败了两次,需要演示者更换手机才能正常工作。虽然演示过程中遇到了一些问题,但最终成功了,GeminiLive最终从图片中提取相关信息并连接日历,为用户提供了准确结果。
值得注意的是,据产品经理LelandRechis介绍,谷歌不允许GeminiLive模仿这10种声音以外的任何声音。谷歌这样做可能是为了避免与版权法发生冲突。此前,OpenAI就因为使用了寡姐的声音而被后者告到法庭。
芯片加持,谷歌硬件全家桶来了
在GeminiLive推出的同时,谷歌也推出了新一代智能硬件设备,比苹果和华为更早。
今天凌晨新发布的硬件包括Pixel9、Pixel9Pro和Pixel9ProXL,还有一款折叠屏手机Pixel9ProFold,它们均由全新的GoogleTensorG4芯片提供支持,可以带来各种生成式AI能力。
Pixel9手机采用全新外观,将摄像头置于正面和中心位置,改进了标志性的摄像头模组,提升了手感。谷歌宣称,这些手机的耐用性是Pixel8的两倍。
这一次,PixelPro机型首次提供两种不同尺寸:Pixel9Pro(6.3英寸)和Pixel9ProXL(6.8英寸),均配备了SuperActua显示屏、42MP前置摄像头。除了显示屏尺寸、充电速度和电池外,Pixel9Pro和Pixel9ProXL拥有相同的规格和功能。
值得注意的是,Pixel9手机采用谷歌全新的定制芯片TensorG4。这是全新一代高性能手机芯片,旨在改善日常用例,例如更快地打开应用程序、浏览网页等等。
TensorG4由GoogleDeepMind设计,三星代工生产,使用Arm架构。经过优化,G4可运行最先进的人工智能模型。它将是第一款运行多模态GeminiNano模型的处理器——仅在手机端侧,就可以实现大模型理解文本、图像和音频等任务。
从目前的消息可知,TensorG4与前代产品相同,使用的核心是当前一代的技术——这意味着它很快会在9月份成为落后的芯片组,名为Mali的静态GPU核心也意味着不支持光线追踪(支持的版本名为Immortalis)。尽管如此,自己和自己比,相对前一代产品的性能提升还是很可观的。
当然,作为DeepMind参与研发的芯片,TensorG4拥有不错的AI算力,谷歌透露它拥有「业界领先」的每秒45token输出速度。
为了确保设备上的AI体验运行顺畅,谷歌也升级了Pixel9系列的内存,它们配备12GBRAM,Pixel9Pro和Pixel9ProXL配备16GBRAM。
Pixel系列一直是谷歌技术应用的标杆,新的手机接入了GeminiLive,且将在8月开卖。谷歌表示,Pixel9Pro、Pixel9ProXL和Pixel9ProFold用户在购买手机后均可享受一年的GeminiAdvanced订阅。看来相比搭载OpenAI大模型的iPhone16系列,谷歌这次做到了快人一步。
谷歌介绍了Pixel的一系列生成式AI能力。
其中,PixelStudio可以帮助你在手机上就能将想法转化为图像。它由运行在TensorG4上的设备端扩散模型和云端的Imagen3文本到图像模型相结合而成。
谷歌的文生图新模型Imagen3最早是在5月份的I/O大会上发布的。该模型在生成细节、光照、干扰等方面进行了优化升级,并且理解Prompt的能力显著增强。随着今天的发布会,GoogleDeepMind在arXiv上提交了Imagen3的论文:
PixelScreenshots可帮助你保存、整理和回忆想要记住的重要信息,以供日后使用。
假设你有朋友喜欢松鼠,她即将过生日。你可以在GoogleChrome上寻找礼物,截取松鼠衬衫、松鼠杯垫等所有松鼠相关的东西的屏幕截图。PixelScreenshots将分析所有这些图像的内容,并帮你在应用中搜索这些信息。随后,你只需打开应用并搜索「松鼠」,这些结果就会弹出。它还会包含你找到的所有内容的链接,以及正在查看的内容的摘要和相关信息。
人们在手机上最常做的事情之一就是查看天气。PixelWeather可以提供更加精确的天气信息,GeminiNano还会生成自定义人工智能天气报告,让人们了解当天的天气情况。
在所有手机都卷的拍照上,Pixel9增加了AI拍摄功能来提升出片效率。
通常,集体照中会遗漏一位指定摄影师。使用AddMe,你就可以与在场的每个人合影,而无需携带三脚架或向陌生人寻求帮助。
利用重新设计的Panorama,现在即使在弱光下也能拍摄出细节丰富的照片。这是所有智能手机上质量最高的弱光全景图。
此外,GooglePhotos中的MagicEditor具有新的编辑功能,你可以拍摄出想要的照片,自动取景功能可以重新构图,你只需输入想要看到的内容(例如:在空旷的田野中添加野花)即可以给照片重新构图,把想法变为现实。
大模型的智能通话记录现在也被集成在了安卓系统重。ClearCalling功能进一步提高了音频质量,新的通话记录(CallNotes)功能会在用户挂断电话后立即发送私人摘要和完整的通话记录。因此,当你接到回电时,无需手忙脚乱地寻找纸笔进行记录。为了保护隐私,通话记录完全在设备上运行。
最新的Pixel9设备是首批配备全新卫星SOS功能的Android手机,因此,即使没有移动网络,用户也可以通过卫星联系紧急救援人员并分享位置。卫星SOS将首先在美国的Pixel9设备上推出,无论你使用的运营商套餐是什么。在Pixel上的前两年,此功能将免费提供。
最后是定价,Pixel9、Pixel9Pro和Pixel9ProXL均已开放预订,起价分别为799美元、999美元和1099美元。Pixel9和Pixel9ProXL将于8月22日在Google商店和谷歌零售合作伙伴上市。Pixel9Pro将于9月4日在美国上市,同时Pixel9ProFold也将在接下来的几周内在其他市场上市。
参考内容:
免责声明:本文章如果文章侵权,请联系我们处理,本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系