Skip to content

showkeyjar/Sonas

Repository files navigation

声象 Sonas

所言即所见 —— AI辅助演讲可视化工具

简介

声象 Sonas 是一款"所言即所见"的AI辅助演示工具,通过实时语音分析,自动生成与演讲内容匹配的视觉画面,帮助演讲者更生动地传达信息。

功能特性

  • 🎤 实时语音识别 - 说话同时转写为文字
  • 🧠 智能语义理解 - 分析关键词、主题、情绪
  • 🎨 多风格画面生成 - 7种视觉风格可选
  • 低延迟响应 - 语音到画面快速呈现
  • ⌨️ 快捷键支持 - Ctrl+Space 快速启停

快速开始

前置要求

  • Node.js 18+
  • Chrome / Edge / Safari 浏览器(需要支持 Web Speech API)

安装

npm install

启动开发服务器

npm run dev

然后打开浏览器访问 http://localhost:3000

构建生产版本

npm run build

构建产物将输出到 dist 目录。

使用说明

  1. 授权麦克风 - 点击"开始演讲"按钮授权浏览器访问麦克风
  2. 选择风格 - 在右侧面板选择喜欢的视觉风格(写实/插画/3D/水墨/赛博朋克/扁平/动漫)
  3. 开始演讲 - 对着麦克风说话,系统会实时转写并生成匹配的画面
  4. 快捷键 - 使用 Ctrl + Space 开始/停止,Esc 停止

支持的语言

  • 中文 (zh-CN)
  • English (en-US)

项目结构

.
├── src/
│   ├── services/          # 核心服务
│   │   ├── speechRecognition.ts   # 语音识别
│   │   ├── semanticAnalysis.ts    # 语义理解
│   │   └── imageGeneration.ts     # 图像生成
│   ├── types/             # TypeScript 类型定义
│   ├── styles/            # 样式文件
│   ├── App.tsx            # 主应用组件
│   └── main.tsx           # 入口文件
├── public/                # 静态资源
├── dist/                  # 构建产物
├── DESIGN.md             # 产品设计文档
└── package.json

技术栈

  • React 18 + TypeScript
  • Vite 6
  • Web Speech API

注意事项

  • 本项目使用浏览器原生 Web Speech API 进行语音识别,需要浏览器支持
  • 当前版本为演示模式,图像使用预置模板
  • 生产环境建议接入真实 AI 图像生成 API(如 Stable Diffusion、DALL-E)

许可证

MIT

About

声象 Sonas 所言即所见

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published