所言即所见 —— AI辅助演讲可视化工具
声象 Sonas 是一款"所言即所见"的AI辅助演示工具,通过实时语音分析,自动生成与演讲内容匹配的视觉画面,帮助演讲者更生动地传达信息。
- 🎤 实时语音识别 - 说话同时转写为文字
- 🧠 智能语义理解 - 分析关键词、主题、情绪
- 🎨 多风格画面生成 - 7种视觉风格可选
- ⚡ 低延迟响应 - 语音到画面快速呈现
- ⌨️ 快捷键支持 - Ctrl+Space 快速启停
- Node.js 18+
- Chrome / Edge / Safari 浏览器(需要支持 Web Speech API)
npm installnpm run dev然后打开浏览器访问 http://localhost:3000
npm run build构建产物将输出到 dist 目录。
- 授权麦克风 - 点击"开始演讲"按钮授权浏览器访问麦克风
- 选择风格 - 在右侧面板选择喜欢的视觉风格(写实/插画/3D/水墨/赛博朋克/扁平/动漫)
- 开始演讲 - 对着麦克风说话,系统会实时转写并生成匹配的画面
- 快捷键 - 使用
Ctrl + Space开始/停止,Esc停止
- 中文 (zh-CN)
- English (en-US)
.
├── src/
│ ├── services/ # 核心服务
│ │ ├── speechRecognition.ts # 语音识别
│ │ ├── semanticAnalysis.ts # 语义理解
│ │ └── imageGeneration.ts # 图像生成
│ ├── types/ # TypeScript 类型定义
│ ├── styles/ # 样式文件
│ ├── App.tsx # 主应用组件
│ └── main.tsx # 入口文件
├── public/ # 静态资源
├── dist/ # 构建产物
├── DESIGN.md # 产品设计文档
└── package.json
- React 18 + TypeScript
- Vite 6
- Web Speech API
- 本项目使用浏览器原生 Web Speech API 进行语音识别,需要浏览器支持
- 当前版本为演示模式,图像使用预置模板
- 生产环境建议接入真实 AI 图像生成 API(如 Stable Diffusion、DALL-E)
MIT