苹果迈入AI时代,Siri总算有智商了

文 / 道哥

当安卓机围绕ai大做文章时,果粉们都在等待苹果ai登场。这一天终于来了。 

6月11日凌晨1点,苹果wwdc 2024(全球开发者大会)如期而至。

不同于去年,此次大会苹果没有推出任何硬件产品,而是将焦点完全集中在了操作系统更新上,依次分享了visionos、ios、ipados、macos、watchos等各大操作系统的全新版本,就是苹果家族os的一次大更新。

之后,apple intelligenc(苹果智能)压轴出场,苹果正式宣布与openai公司合作。但是,就像往年一样,苹果仍然免不了迎接“缺乏创新”的吐槽,也遭到了马斯克连续发文“炮轰”。那么,苹果wwdc 2024到底讲了什么?

01 更加“个性化”的ios 18

按照发布会的时间线,我们捋一下苹果具体讲了哪些东西。 

首先登场的是apple tv+,这个和国人关系不大,我们可以直接略过。然后正式登场的是备受关注的visionpro最新系统:visionos 2。 

本次全新升级的visionos 2带来了空间照片功能。通过ai计算分析,visionos 2可以把图库中的所有2d图像转化成空间3d实景尺寸的图像。而且在整体交互上也有所升级,提供了更多快捷手势。

最让果粉感兴趣的可能就是visionpro要在中国大陆发售了,售价29999元。但据智百道了解,这价格比闲鱼上贵了一个w,苹果对国内用户还真是自信。

visionpro之后就是重头戏,ios 18正式登场。而如果给这次的ios的更新总结一个关键词,就是“个性化”。

首先,ios 18拥有可定制的主屏幕,你可以自由地将应用程序图标放置在你想要的任何位置。

比如你可以把喜爱的墙纸、应用程序和各种小组件添加到主屏幕中。而且,现在苹果还可以设置全新的深色外观模式,匹配你喜欢的桌面色调和风格。

而且,你还可以自定义所有app小组件的主题色,ios也会根据壁纸风格自动推荐匹配色调。

控制中心的升级也体现了“个性化”,你可以在多个控件之间滑动。面向开发者,ios推出了新的控制api,支持开发者把app加进控制中心,长扫即可调出其它控制项,布局、大小均可调整。

而且,在锁屏状态下,原来的相机和手电筒功能,都可以替换为其它控制项。

安全隐私方面,ios 18也推出了个性化设置。

你可以单独锁定某一个应用,给它“上锁”,打开它需要通过验证,且上锁后该应用的内部信息不会出现在搜索、通知等手机系统的其它地方。更进一步,你还可以把不想被外人知道的应用藏起来,放进一个新的带锁的隐藏app文件夹。

具体的应用app上,ios 18在“个性化”上也下了功夫。其中就包括被官方称作“迄今为止最重磅的设计更新”的图库(photos)新功能。

在图库的上半部分,ios 18延续之前的的网格视图,适合浏览所有图片;下半部分新增了对图片按时间、主题进行分类整理的“小相册”。此外,还包括人脸识别分类、照片集置顶等一系列快捷访问功能。

另一个最常用的app短信(messages)上,在信息回复中,苹果增加了更多的表情符号,并且将有粗体、下划线、删除线和斜体的新格式展示。而且,还可以给给文字添加特效。

这里智百道感觉最值得一提的是,苹果还增加了卫星通信功能,在没有联网的情况下,可以通过卫星进行信息发送。

这个功能国内高端机型已开始普及,苹果看起来是跟上潮流了,但发布会上没有公布具体细节,具体效果还不清楚。

其它方面,ios 18还推出了safari、地图、钱包、游戏模式等等一堆细枝末节的更新,就不逐一说明了。

对于ios 18的这次更新,有人吐槽说是“ios18史上最小更新”。对此,智百道认为,ios 18现在已经不是苹果的重头戏,期待不要太高,最近这些年以来,也应该习惯苹果在创新方面的调性了。能在原来的基础上优化体验,就已经算是及格。

02 其它os更新的亮点

ios 18之后,发布会依次介绍了macos、ipados、tvos和watchos等几大系统,智百道挑选重要的亮点说一下。

macos方面,苹果正式公布了macos 15 sequoia。

这里值得关注的是iphone镜像(iphone mirroring),通过这个功能,你可以用mac来控制手机。比如,你可以点咖啡、加备注,iphone的通知、音频可以与mac上互通,mac的内容也可以更方便地传送到iphone上。

这个功能确实非常方便,演示中可以看到,通过iphone mirroring,可以像操作手机一样滑动屏幕,甚至可以通过mac键盘在手机上进行打字。

此外,macos 15 sequoia还新增一个跨平台的passwords应用,可以存储多种新类型的帐户信息,包括wi-fi密码、密钥、验证码和共享密码等,未来将在ios、ipad、mac、visionos和windows上使用。

ipados 18也有一个重大更新,就是终于引入了计算器,添加了math note系统。

新的系统支持识别手写公式、自动求解、自动画函数曲线等功能,你可以利用pencel直接手写数学算式,然后直接帮助你计算出结果,甚至能帮你计算复杂公式,并且可以理解所有不等式里的变量变化。

比如你用apple pencil写一个数学表达式,写下等号之后,计算器会自动算出结果。如果修改表达式,结果也会实时更新。

而且,新功能还支持更复杂的计算,比如一个物理题,以不同角度和速度击打乒乓球时,乒乓球能到达的最高高度。

你只需在数学笔记中写出各种变量的数字,然后计算器就可以直接在公式中进行计算。写成函数表达式,点击等号,还能直接画出函数曲线。调整变量,函数曲线随之改变。

而且,在手写方面,系统利用机器学习,还可以模仿你的笔迹,让书写更加自然。同时,其还支持将键盘打出的内容一键生成手写笔记、拼写检查、校对纠错等。

总结下来,智百道感觉苹果在六大系统的更新上有些亮点,但不算多,主要是一些细节体验上的提升。所以,不少熬夜看发布会的果粉吐槽快看睡着了,甚至有的已经预定了“骂苹果”的热搜。

压轴的apple intelligence给苹果救了场。

03 苹果ai登场,siri重获新生

相比其它厂商,苹果没有过多强调ai手机这个偏宏大的概念,而是把ai都落在了具体的应用场景上。

文字处理上,apple intelligence推出了“优先通知”的功能。

开启这项功能后,系统可根据通知内容的重要性进行排序,最重要的信息,比如,写有用户航班登机牌的邮件会被放在最上方展示。

但是,对于“重要信息”的判定标准,苹果并没有说明,可能是基于用户的使用习惯、app的使用频次,也可能是基于对自然语言理解力。

文字处理当然离不开写作,apple intelligence还推出了全系统内的写作工具,应用范围涵盖邮件、备忘录、pages及各类第三方应用,用户可以在各种应用场景中扩写、校对和总结文本,同时还能调整措辞语气,或是获得智能回复的建议。

图片处理上,apple intelligence引入了genmoji和inmage wand功能。

前者可以根据你的描述,生成最符合你心意的图片及表情包,还能根据相册中的人物进行定制,目前还仅支持素描、卡通和插画三种风格;后者可以帮助用户将粗略的手绘草图,转化为更加精美的图片,或直接实现文生图。

这里智百道需要指出,对比实际演示中的效果和其它如stable diffusion等大模型,apple intelligence的能力还存在一定的差距。

此外,apple intelligence还支持清除照片中的干扰物、使用自然语言搜索图像视频等功能。比如你想寻找上周发的文件、和女朋友的照片等等,开口说出来,系统就会自动进行寻找。

语音通话方面,apple intelligence能够对录音内容自动生成摘要、总结电话录音等。这个功能虽然看起来很普通,但智百道认为能够解决苹果用户的一个痛点,非常实用。

需要指出的是,在使用此功能时,电话对方会接到一则通知。

隐私保护方面,apple intelligence提供了两种解决方案。首先,能在端内运行的大模型功能就会仅通过端侧ai运行,苹果只在端内收集信息,但不会传送到云端。大多数ai功能均可在端侧完成,这主要是苹果的超强芯片的功劳。

其次,如果复杂到非要用云端模型的话,为了保证云端使用和信息安全,苹果打造了私人云端计算。这些模型都会在他们使用apple silicon专门创建的服务器上运行,因此也拥有极强的隐私保护功能。

苹果软件工程高级副总裁craig fedrighi表示,“这些上传到云端的数据绝对不会被储存,就连苹果都无法访问,数据只用来执行请求。”

对比不久前微软recall被黑客破解事件,苹果在隐私保护上提出的解决方案更为完备。

以上就是apple intelligence在ai方面的能力,都将随着ios 18、ipados 18、macos sequoia免费提供。

如果苹果到此为止,智百道认为这场发布会只能算勉强及格,但苹果还有大招,就是联手chatgpt,对siri进行了全新升级,siri 2.0正式登场。

其实,当初siri推出时,乔布斯将其视为一个能够颠覆行业的产品,他相信,通过siri的智能语音交互,能够让人们的生活更加便捷,进而拉近人与科技的距离。

众所周知,多年来,乔布斯的这个设想一直没能实现。

如今,乔布斯的梦想看到了实现的希望,因为苹果与openai达成了深度合作意向,前不久发布的gpt-4o模型,已经被完全整合在siri中。

你不用创建账户,就可以免费使用这个模型的大部分功能。而在gpt-4o的加持下,siri有了质的提升。

首先在外观上,siri在对话时,屏幕边缘会环绕一圈光晕,显得非常有科幻感。

在响应上,siri真正有了“智能体”的感觉。在对话中,即便新增了连续对话功能,siri也能够很自然地理解上下文内容。而且,siri可以基于用户的照片、日历、文件、邮件等信息进行“语义索引库”排列,实现更加智能的信息搜索及提取。

比如,用户需要在一份文件中填写驾驶证编号,siri可以调用相册中的驾驶证图片,自动将编号填写进文件。

而且,siri还可以支持跨应用操作app,比如,你要寻找某个人的照片,siri找到之后,可以按照你的指令进行修图优化,然后再放入指定备忘录中对应人物的简介里面。

作为受益最大的应用,这次更新,说siri重获新生也不为过。

未来,苹果表示,明年将会为siri推出更多新功能,包括让siri了解显示屏内容的屏幕感知功能,让siri代表用户在应用程序中采取行动。

是不是有了点钢铁侠中,人工智能管家“贾维斯”的感觉?

说在最后

其实,在智百道看来,此次苹果发布会上诸如文本摘要、图片生成、照片查找、ai智能助理等一系列ai功能,安卓机其实早就有了,apple intelligence的创新性并不高。

而且,苹果未来在ai方面有多大的进步,很大程度上取决于openai。以苹果的调性,如果自己能够搞定,绝不会去拥抱别人,更何况openai和老对手微软有着千丝万缕的联系。

但尽管如此,相比竞争对手,苹果的优势在于软硬件结合,对自家系统生态拥有着绝对控制权。这就能够使ai与系统原有的app或功能更好的融合,给用户一种更加无感、更加自然的使用体验。

系统体验好,一直都是苹果的杀手锏。

最后需要指出,apple intelligence仍处于内部开发测试状态,今年秋季前不会向开发者开放,并且目前apple intelligence仅支持英语,部分功能、更多语言和平台支持需要等到明年,国内用户还需要耐心等待。

发布会结束后,面对苹果+openai的强强联合,马斯克发起“炮轰”,直言"苹果不够聪明,无法制造自己的ai,却认为能够确保 openai 保护你的安全和隐私,这显然是荒谬的!"

他甚至表示,要在自己公司禁用苹果设备。

苹果ceo库克也发了一条推特,表示“apple intelligence是苹果ai的下一篇章”。

苹果终于拥抱了ai,智百道愿意将之称为“迎头赶上”,但远谈不上领先对手。在ai手机这条路上,大家都在抢跑,而苹果无疑是最强的选手之一。