Airi:一个开源的“数字生命”框架,想拥有自己的AI虚拟人吗?
哈喽,大家好,我是老善。
最近在GitHub上瞎逛,发现一个叫 Airi
的项目,Star涨得飞快,口号也挺吸引人,叫“拥有你自己的数字生命”(Own your digital life)。点进去一看,好家伙,这不是一个简单的聊天机器人,而是一个正儿八经的、能让你在自己电脑上部署一个AI虚拟人的开源框架。
作为一个天天和代码打交道的工程师,看到这种项目就手痒,于是花时间研究了一下。今天就用大白话,给大家聊聊这个叫Airi的东西到底是个啥,有啥技术含量,以及普通人想上手玩玩该从哪开始。
Airi 是个啥?
简单来说,Airi 的目标是让你能创造一个可以7x24小时陪伴你的AI虚拟伙伴。如果你知道虚拟主播 Neuro-sama,那你大概就能明白Airi想干什么了。不过,和Neuro-sama不一样的是,Airi是完全开源的,你可以把它部署在自己的电脑上,所有的数据和交互都掌握在自己手里,不用担心哪天服务商就把你的“老婆”给关了。
根据官方的介绍,它有几个核心特点:
- 开源且可自托管:所有代码都在GitHub上,你可以自己部署,自己修改,拥有完全的控制权。
- 实时语音聊天:这不是一个打字聊天机器人,它被设计用来进行低延迟的语音对话,给你更真实的交互感。
- 能玩游戏:这是最酷的一点,文档里明确提到,它可以作为一个游戏代理,和你一起玩《我的世界》(Minecraft)和《异星工厂》(Factorio)这类游戏。
- 支持多种虚拟形象:你可以给它套上你喜欢的VRM或者Live2D模型,让它有一个具体的形象。
- 跨平台:既有Web版,也有桌面版。
说白了,Airi 就是一个集成了大语言模型(LLM)、语音合成(TTS)、语音识别(ASR)以及虚拟形象驱动等一系列技术的“缝合怪”,但它把这些东西很优雅地整合在了一起,目标就是创造一个有“灵魂”的数字生命。
技术含量怎么样?
作为一个技术人员,我更关心的是它“骨子里”的东西。不看不知道,一看还真有点东西。
首先,它的技术栈选型就挺有意思的:后端/核心用 Rust,前端用 TypeScript + Vue.js。
- 用 Rust 很好理解。这种实时交互、需要处理大量数据流的应用,对性能和稳定性的要求极高。Rust的内存安全和高并发特性,简直就是为这种场景量身定做的。
- 用 TypeScript 和Web技术栈也很有道理。这让Airi可以轻松地做一个Web界面,甚至把很多计算(比如渲染)放到浏览器里去做。我看了一下,项目里用到了 WebGPU、WebAssembly (WASM) 这些前沿的Web技术,说明开发团队对性能的追求是全方位的。
更硬核的是,它的桌面版能直接利用 NVIDIA CUDA 和 Apple Metal,这意味着它可以充分调用你的显卡资源来做AI计算和图形渲染,而不是一个简单的“网页套壳”。
其实,这类项目的技术核心和难点在于打通一条低延迟的实时语音交互链路,也就是:
VAD (语音活动检测) -> ASR (语音识别) -> LLM (大模型处理) -> TTS (语音合成)
这个链条上任何一个环节慢了,都会让交互变得卡顿和不自然。Airi 选择了用Rust来构建核心,很可能就是为了把这个链路的延迟做到极致。
另外,我还注意到项目里有 flake.nix
这样的文件,说明它支持用 Nix 来进行可复现的环境构建。能用上Nix的团队,通常都对工程化有比较高的追求,这让我对这个项目的长期发展多了几分信心。
怎么上手试试?
聊了这么多,那到底怎么才能跑起来玩玩呢?
说实话,我研究了一圈下来,发现这个项目目前还处于比较早期的阶段,上手门槛不低,社区里还没看到保姆级的教程。如果你是个喜欢折腾的开发者,可以按下面的思路去试试。
- 准备工作:
- 首先你得有个不错的开发环境。根据项目文件分析,你很可能需要提前装好 Rust 和 Node.js 的环境。具体版本要求,建议去翻一下项目根目录下的
.tool-versions
文件。 - 你需要准备好各种AI服务的API Key,比如 OpenAI、Claude、Gemini 等。这个项目支持多种大模型,你得有至少一个能用的。
- 拉代码,装依赖:
这个是常规操作了。
Bash
git clone https://github.com/moeru-ai/airi.git
cd airi
pnpm i
注意,项目用的是pnpm
,不是npm
或yarn
。
- 启动!
-
运行Web版:
Bash
pnpm dev
这个应该是最简单的启动方式,主要用来调试UI界面。
-
运行桌面版(功能更全):
Bash
pnpm dev:tamagotchi
注意! 运行这个命令之前,才是最关键的一步。你需要仔仔细细地阅读项目根目录下的
CONTRIBUTING.md
文件,里面应该有详细的环境配置要求和依赖说明。由于工具限制,我没法直接把内容贴出来,但这是成功运行的关键。
- 配置:
项目里应该有一个类似 .env.example 的配置文件模板。你需要把它复制一份,重命名为 .env,然后把你的API Key之类的东西填进去。
总的来说,现在的Airi更像是一个给开发者准备的“开发者套件”,而不是一个开箱即用的软件。我还看到GitHub的Issue里有人在提议把项目Docker化,这也从侧面说明了目前环境配置确实是劝退新人的一个点。
我的一些看法
它和别的AI项目有啥不同?
- 对比 LangChain 这类框架:LangChain 更像是一个AI开发的“兵工厂”,它给你提供各种零件(工具、模型、链),让你自己去组装成各种AI应用。而 Airi 的目标更明确,它就是要做“数字伴侣”这一个产品形态,更像是一个“整车制造图纸”。
- 对比 Jan.ai 这类本地AI助手:Jan.ai 这类项目更侧重于提供一个本地、注重隐私的LLM聊天客户端。而 Airi 的野心更大,它不只满足于聊天,更强调 “具身智能” 和 “交互”,也就是要有虚拟形象,能感知环境(比如你在玩游戏),并参与其中。
所以,Airi最大的亮点和差异化,就在于它对“数字生命”这个概念的专注。
未来可期吗?
我看了一下社区的讨论,发现开发者们正在规划一个插件系统。
这意味着什么?意味着未来社区可以为Airi开发各种各样的“能力插件”。比如,写一个插件让它能控制你的智能家居,写一个插件让它能帮你读邮件、管理日程,甚至写一个插件让它在更多的游戏里和你互动。这个想象空间就非常大了。
总结
Airi 是一个非常有想法、技术实力也很强的开源项目。它精准地切中了“AI伴侣”这个很多人幻想过的领域。
不过,也要泼一盆冷水,它目前还非常“硬核”,离普通用户能轻松使用的产品还有很长的路要走。文档也不算完善,需要使用者有很强的动手能力和解决问题的能力。
但对于我们这些喜欢探索新技术的开发者来说,Airi无疑是一个非常值得关注和学习的宝藏项目。就算现在不亲自上手,把它加到你的GitHub Star列表里,持续关注它的进展,也是一件很有意思的事。
好了,今天就和大家聊这么多。如果你对Airi有什么想法,或者成功把它跑起来了,欢迎在评论区分享你的经验!

评论
发表评论
|
|