遗忘曲线揭示了一个惊人的事实:新学到的知识在短短一周内大部分会被遗忘,而到了一个月,几乎忘得一干二净。这不禁让人想起那句老话:“好记性不如烂笔头。”而今天,借助AI技术,我们真的能够打造一个“智能烂笔头”,帮助记录并管理我们的个人信息。
设想一个能够全面掌握我们生活细节的应用程序:从会议安排、任务清单到浏览器历史、电子邮件,甚至是日常琐事,它都能为我们梳理得井井有条,让信息触手可及。这样的工具听起来就让人倍感期待,仿佛能为我们解决所有遗忘的烦恼。
或许是因为自己也逐渐步入“忘事”的行列,我对个人信息记录产生了浓厚的兴趣。我的母亲已年近百岁,她深信“好记性不如烂笔头”,因此积累了无数笔记本,记录着家中的开支、电脑中的邮件、微信的各种密码、亲友的联系方式,甚至用药指南和菜谱。而我,也开始思考是否能为她打造一个AI记事本,自动记录生活中的点点滴滴。
但仅靠笔记本显然是不够的。个人信息的记忆功能远不止于此,它更像是一个庞大的个人信息模型(Personal Information Model),让我们在数字化社会中成为“数字孪生”。在AI的助力下,这个模型可以极大地提升生活的便捷性。比如,当你发现牙膏快用完了,只需告诉AI助手,它就会自动去你常去的网店购买你喜爱的品牌。在线购物时,它能根据你的喜好精准推荐商品;看病或购药时,它还能根据你的健康记录给出建议。
尽管我作为AI领域的初学者,但已经尝试了一些构建个人信息模型的实验。我首先编写了一份个人自传,记录了基本信息、爱好、教育和工作经历,并利用RAG技术将信息存储在矢量数据库中,以便在对话时快速检索。随后,我不断将新的个人信息添加到Recording.txt中,并通过RAG技术读入数据库。然而,这种方法存在一些缺陷,如每次都需要读取整个文件生成vector_retriver,效率不高。
另一种方法是利用langchain的记忆功能(Memory),将我与AI的对话永久记录在基于矢量数据库的memory中。但在实际操作中,我发现对话内容中包含了大量无需记忆的信息,这些干扰了AI的信息提取效果。因此,我意识到需要另辟蹊径来优化这一功能。
在微软Build开发者前瞻大会上推出的Windows 11 Recall工具就是一个很好的例子。它能记录你在电脑上看到和做过的一切,并让你搜索和检索设备上的任何内容。而在苹果公司的WWDC全球开发者大会上,“苹果智能”也宣布将为iPhone、Mac等设备提供一系列AI功能,其中个人信息记录和提取技术尤为引人注目。这些巨头们的动向也表明了在终端设备上构建本地个人信息模型在AI时代的重要地位。
Rewind是一个为Apple Silicon驱动的Mac推出的应用程序,它能记录你在计算机上所做的一切,并提供你参加过的会议、访问过的网站以及键入或单击的所有内容的时间表。它甚至能接受ChatGPT的提示来查询你的数据库以获取相关信息列表。这种“你生活的搜索引擎”的概念虽然颇具争议,但随着数字生活的日益复杂和分散,我们将需要这样的工具来帮助我们理解这一切。
除了Rewind之外,还有Lindy这样的AI助手正在崛起。它被誉为“ChatGPT可以访问您的所有应用程序”。像Mem、Notion和Reflect这样的笔记应用程序已经开始集成大型语言模型(LLM),而谷歌和微软这两家巨头也在研究LLM如何与我们的个人数据交互。无论你喜不喜欢,聊天机器人都在逐渐融入我们的生活。
关于如何实现rewind的技术细节尚未完全公开,但通过观察一些开源项目可以发现,它们主要通过从其他APP中提取数据或利用截屏和OCR技术提取图片中的文字信息来存储到数据库中。使用sqlite3数据库和sentence transformer进行相似度匹配是一种常见的方法。然而,我预计直接使用memory的效果可能不佳,因此考虑将信息存储到传统数据库中以提高效率和准确性。
总的来说,我们正在努力构建一个完善的个人信息模型并利用AI进行存取管理。在后续的文章中我将不断报告实验结果并欢迎读者提出宝贵建议共同探索这一领域的发展潜力。