Skip to content

建议:集成 FunASR/SenseVoice 语音识别能力 #61

@LauraGPT

Description

@LauraGPT

功能建议

AIGCPanel 作为一站式 AI 数字人系统,集成 FunASR/SenseVoice 可以增强语音交互能力。

适用场景

  • 数字人语音交互:实时识别用户语音指令
  • 视频字幕生成:为合成视频自动生成字幕
  • 声音克隆数据标注:使用 FunASR 自动标注训练数据

FunASR 优势

  • 中文识别极准:AISHELL 基准上 CER < 2%
  • 速度极快:非自回归架构,GPU 170 倍实时
  • 内置标点:自动添加中文标点
  • 情感识别:SenseVoice 可识别说话人情绪
  • 说话人分离:cam++ 模型支持多人对话
  • 完全本地:无需联网,保护隐私

快速集成

pip install funasr

from funasr import AutoModel
model = AutoModel(model="iic/SenseVoiceSmall")
result = model.generate(input="audio.wav")

如有兴趣,欢迎交流!

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions