谁能想到蔡依林的《倒带》还真有了现实版。当然,逝去的感情很难倒带,数字痕迹却有可能再度获得。
重温一个想法时,我们常常想不起更多细节。好像在哪里看到或者听到过,微博、公众号?还是会议室的白板上?抑或是同事在腾讯会议上说过?
如果它藏在今天收到的上百条 Slack 消息中,再找到它无异于一场灾难。
遗忘曲线告诉我们,绝大部分新掌握的知识约在一周后被遗忘,一个月左右基本忘光。「好记性不如一个烂笔头」,一家名为 Rewind AI 的创业公司还真做出了这个「烂笔头」:Rewind(翻译过来有「倒带」的意思,目前面向 iPhone、Mac 用户)。
官方将这款 AI 应用称为「你生活的搜索引擎」 ,用户可以通过它随时回溯过往数字信息,就像有了「过目不忘」的超能力。
具体而言,得到你的同意后,Rewind 会记录下你在手机(电脑)上看过的所有信息,并支持回看、检索、总结概要等功能,相当于随时帮你截图保存,而且保存的结果是可检索、可交互的。
就苹果手机客户端来说,它主要包括以下功能。
首先,它会自动捕获你在 Safari 浏览器中阅读的内容,包括导入的屏幕截图,你可以随便浏览和搜索。
应用启动后,屏幕下方会出现一条可以来回滑动的时间线,滑动它即可显示你之前使用过的内容。
![](http://www.openaimy.com/wp-content/uploads/2023/08/ec44b748a0ff4b6048102b9a7902135b.gif)
官方Demo中浏览某应用的情况。
机器之心也用苹果手机试用了一下,滑动条上的每个图标都代表着刚才浏览过的网页,包括浏览的时间。
![](http://www.openaimy.com/wp-content/uploads/2023/08/97820b004cf0245205efdff447b9028a.png)
在搜索功能里,输入「law」,Rewind 将我们刚才浏览过的包含这个关键信息的页面呈现出来。因为接入了 Gpt-4,连带有「law」内容的图片也会被准确搜索出来。
![](http://www.openaimy.com/wp-content/uploads/2023/08/3efdf893c75ae3e452b1d28cb07e6e12.png)
在 「Ask Rewind 」功能里,因为接入了 GPT-4,我们可以就自己看到的任何内容提出问题,包括创建摘要,跨应用总结信息。
我们尝试让它总结浏览过的网页中有关 GPT-4 法律应用的案例,结果找到了。
![](http://www.openaimy.com/wp-content/uploads/2023/08/8e3a7bff7bd91527d582bc154bd4cba9.png)
有推特网友使用 Ask 功能让 Rewind 总结一天当中他感兴趣的信息。
除了快速浏览过去的任何内容,还能进行复制粘贴操作。
![](http://www.openaimy.com/wp-content/uploads/2023/08/04bc2058ba8bad7f9e4bc9218640f8d6.gif)
针对 Mac 电脑开发的客户端功能更加强大,包括自动整理会议摘要、起草电子邮件等。
![](http://www.openaimy.com/wp-content/uploads/2023/08/63f9a8203bf73624c6fff2b2a73bbe67.png)
![](http://www.openaimy.com/wp-content/uploads/2023/08/d9d50e46b2ee33f992fe3a6c642fab5c.png)
知乎网友的使用体验(部分内容截图)
总体来说,Rewind 还是很有自己特点。
首先,因为使用的是光学字符识别(OCR)来识别和索引屏幕上出现的所有单词,所以,无需与 Gmail,Dropbox 或 Slack 等云产品集成,既可实现「倒带」。
此外,OCR 使用户能够复制和粘贴过去的任何内容。
其次,为了搜索用户所说的或听到的任何内容,他们使用了最先进的自动语音识别 (ASR),尤其是针对会议发言、讨论和决策内容,甚至以可视方式共享的内容,Rewind 都可以捕获它们。
就图片信息而言,只要你说出关键词,Rewind 会先根据会议音频内容生成文字记录,再根据文字记录定位关键词并显示相应图片内容。
另外,出于隐私考虑,所有录音会本地存储在用户的电脑包括手机,只有用户可以访问它们。用户数据也不会用于训练 AI 模型。
虽说 OCR、ASR 可以在本地完成运作,但用户与 Gpt-4 的交互仍然需要将数据送往云端。Rewind 的解释是,「仅有基于文本的相关数据」会被传至云端,不包括其他音频、视频、图像类。
除了GPT-4 赋予的底层能力使「倒带」成为可能,Rewind 的成功还离不开苹果特色的硬件基础设施。这也是为什么他们先推出电脑版本,再过渡到苹果手机。
比如,芯片。最初,产品仅在最新的 Mac 上工作,因为它们依赖于苹果的 M1 和 M2 芯片。
「我们几乎利用了片上系统 (SoC) 的每个部分,因此运行 Rewind 在录制时不会占用系统资源(如 CPU 和内存)。感觉几乎难以察觉。」Rewind AI 联合创始人 Dan Siroker 在官方博客中写道。
另外,还需要发明一种压缩技术以适应现有硬盘规格。在本地存储所有录音意味着压缩技术非常重要。Rewind 可以将原始记录数据压缩多达 3,750 倍,而不会造成重大质量损失,例如,10.5GB 的原始录制数据变为 2.8MB。
即使你的苹果产品用的是最小硬盘驱动器,也可以存储多年的录音。
![](http://www.openaimy.com/wp-content/uploads/2023/08/d73a81f7c3d58504c45db41b903dcdd4.png)
Dan Siroker 在 20 多岁时开始失聪。30 岁时,助听器改变了他的生活。失去一种感觉,又重新获得它,感觉就像获得了一个超能力。从那一刻起,他一直在寻找用技术增强人类能力的办法。
就像我们的听力一样,随着年龄的增长,人类记忆力会变差。我们有助听器和眼镜对抗衰老带来的能力衰退,那么,记忆力呢?这也是他们创立 Rewind 的原因——给人类完美的记忆能力。
事实上,他们在 2020 年就开始追求这一愿景,并为此构建了第一款产品 Scribe,一个记录你所有会议并使其可搜索和共享的 AI 机器人。在拥有 30,000 名用户之后,经验和反馈让他们转向 Rewind 的开发。
Rewind 刚推出就获得 a16z 领投的 1000 万美元种子轮融资。除了产品本身,部分原因也在于 Dan 也是一名连续创业者,他的第一家公司 Optimizely 的投资人也包括 a16z。
![](http://www.openaimy.com/wp-content/uploads/2023/08/1caa493988c07742319897da292e1fff.png)
目前,Rewind 已经能支持 Chrome、Safari、Arc、Brave 等多种浏览器,以及不少线上会议应用(Google Meet, Microsoft Teams, Slack huddles, Webex, Discord 等),也支持播客、Youtube 视频或用户自己的笔记。
可以说,「倒带」这类应用的能力变强,依赖于可支持的生态丰富程度,更离不开用户授权。当你授权的应用越多,又自然引发担心:Rewind 对个人隐私的威胁。
当我们打开应用时,迎面而来的就是一系列需要授权的请求,包括在我看来非常隐私(以至于几乎不授权给任何手机应用)的应用程序(例如相册),有多少人会将这些非常隐私的足迹共享给一个 AI 应用呢?特别是当人看过斯诺登的 Permanet Record 以后。
Rewind 是付费的,价格并不便宜。所谓免费,也仅限于 50 次试用。其中浏览、搜索和 Ask(Gpt-4),每个功能启用一次就算消耗了一次。12 美元的月付费只有 10 次的「倒带」机会。虽然 36 美元套餐不限次数,但考虑到它目前还很难说是刚需,36 这个数字仍然感觉偏贵。