常见问题
录音相关
录音没有声音 / 转写结果为空
- 检查麦克风是否被系统识别
- 确认录音工具已安装(
parecord) - 查看日志输出:
RUST_LOG=altgo=debug altgo
录音启动慢
首次启动录音时设备初始化可能需要几秒,后续会更快。
按键相关
按右 Alt 没有反应
- 用户是否在
input组并已重新登录? 无法读取/dev/input/event*时,按键监听会失败:sudo usermod -aG input "$USER"后注销/重启再试。 - 确认
xinput可用:which xinput(X11 路径)。 - 检查 Alt 绑定:
xmodmap -pke | grep Alt;配置里默认key_name = "Alt_R",与设置页「按下以设置」一致即可。 - Wayland:仍依赖能访问 evdev;若仅用 XWayland 且无权限,现象与未加
input组类似。剪贴板在 Wayland 上建议安装wl-copy(或xclip/xsel经 XWayland)。 - 若使用 IME,可适当增大
min_press_duration_ms减轻误触。
误触发 / IME 冲突
增加 min_press_duration_ms 的值(默认 100ms)来过滤短按抖动:
[key_listener]
min_press_duration_ms = 200
转写相关
中文识别效果不好
- 使用更大的模型(推荐
medium或large) - 确认
language = "zh"设置正确 - 如果使用 API 模式,可以设置
prompt提供领域词汇
[transcriber]
language = "zh"
prompt = "技术会议,产品讨论"
本地模型在哪里下载?
从 Hugging Face 下载 GGML 格式模型:
| 模型 | 大小 | 中文效果 |
|---|---|---|
| tiny | ~75 MB | 一般 |
| base | ~148 MB | 日常够用 |
| small | ~488 MB | 较好 |
| medium | ~1.5 GB | 推荐 |
| large | ~3 GB | 最佳 |
下载地址:https://huggingface.co/ggerganov/whisper.cpp/resolve/main/ggml-{size}.bin
润色相关
润色太慢
- 降低润色级别(
heavy→medium→light) - 使用更快的模型或本地 Ollama
- 设置
level = "none"关闭润色
润色改变了原意
使用 light 级别,只修正标点和错别字,不改变内容。或者使用自定义 system prompt:
[polisher]
level = "light"
system_prompt = "只修正标点和错别字,不要改变原文的意思和语气"
剪贴板与悬浮窗
提示成功但粘贴出来是旧内容 / 剪贴板失败
- Linux:安装
xclip、xsel或wl-copy之一,并确保在图形会话内运行 altgo。 - 在悬浮窗或历史页使用复制按钮(WebView 手势复制有时比后端剪贴板更稳)。
- 调试:
RUST_LOG=altgo=debug altgo查看是否有 clipboard 相关错误。
通用
如何后台运行?
nohup altgo &
# 或使用 systemd user service
如何查看日志?
RUST_LOG=altgo=debug altgo
可用的日志级别:debug、info、warn、error