FnKey是一个轻量级的macOS菜单栏应用程序,通过按住Fn键说话来启用快速的语音转文本转录,并在释放时自动粘贴转录的文本。
https://github.com/evoleinik/fnkey?ref=producthunt&utm_source=aipure
FnKey

产品信息

更新于:2026年03月17日

什么是 FnKey

FnKey是一款创新的Rust开源生产力工具,为macOS带来了无缝的语音听写功能。它位于菜单栏中,提供了一种简单而强大的方式,可以在任何应用程序中将语音转换为文本。该应用程序只需要最少的设置 - 用户只需从Deepgram或Groq配置API密钥以用于转录服务,授予必要的系统权限,即可开始听写。

FnKey 的主要功能

FnKey 是一款轻量级的 macOS 菜单栏应用程序,通过简单的按住说话界面实现语音转文本的转录。用户可以按住 Fn 键来录制语音,使用 Deepgram Nova-3(流式)或 Groq Whisper(批量)API 实时转录,并在释放后自动粘贴到任何文本字段中。该应用程序具有自定义关键字支持、音频增强和以隐私为中心的设计,麦克风仅在按键期间激活。
实时流式转录: 使用 Deepgram Nova-3 API 流式传输音频并在说话时转录文本,提供即时反馈和更快的结果
双后端支持: 提供 Deepgram(流式)和 Groq Whisper(批量)转录选项,并具有自动回退功能
以隐私为中心的设计: 麦克风仅在按下 Fn 键时激活,菜单栏和系统级别都有视觉指示器
自定义词汇支持: 允许用户添加专业术语、专有名词和技术词汇,以提高转录准确性

FnKey 的使用场景

软件开发: 开发人员可以快速口述代码注释、文档和技术笔记,同时保持双手在键盘上
内容创作: 作家和博主可以通过语音输入快速起草内容,同时保持自然的工作流程
辅助功能: 为行动不便或患有重复性劳损的用户提供替代的文本输入方法
会议记录: 专业人士可以在会议期间快速捕捉想法和行动项目,而无需切换窗口

优点

简单直观的按住说话界面
以隐私为中心的设计,具有清晰的麦克风状态指示器
支持具有自动回退功能的多个转录后端

缺点

语音开始时略有录音延迟
需要来自外部服务(Deepgram/Groq)的 API 密钥
目前仅限于 macOS 平台

如何使用 FnKey

下载并安装: 从GitHub Releases下载适当的版本(Apple Silicon为FnKey-arm64.zip,Intel为FnKey-x64.zip),解压缩并移动FnKey.app到Applications文件夹
配置API密钥: 创建配置目录并添加API密钥:1) 创建目录:mkdir -p ~/.config/fnkey 2) 添加Deepgram密钥:echo 'your-deepgram-key' > ~/.config/fnkey/deepgram_key 3) 添加Groq密钥:echo 'your-groq-key' > ~/.config/fnkey/api_key
启动应用程序: 使用以下命令从Applications文件夹打开FnKey.app:open /Applications/FnKey.app
授予权限: 转到系统设置→隐私和安全性,并授予FnKey.app以下权限:输入监视(以检测Fn键)、麦克风(以录制语音)和辅助功能(用于自动粘贴)
基本用法: 按住Fn键说话,然后释放以转录并粘贴文本。菜单栏图标从○(空闲)变为●(录制)
配置可选设置: 单击菜单栏图标(○)以:1) 切换“粘贴后按回车”功能 2) 通过“编辑关键字...”选项编辑自定义关键字 3) 在Deepgram和Groq后端之间切换
添加自定义关键字: 为了提高转录准确性,通过菜单栏→“编辑关键字...”或直接编辑~/.config/fnkey/keywords文件来添加常用的技术术语或专有名词

FnKey 常见问题

FnKey是一个macOS菜单栏应用程序,允许您通过按住Fn键说话,将语音转换为文本。当您松开按键时,它会转录您的语音并自动粘贴文本。

与 FnKey 类似的最新 AI 工具

MicVoice.Ai
MicVoice.Ai
MicVoice.Ai是一个全方位的AI语音生成平台,将书面文本转换为高质量、自然的语音,支持17多种语言,提供超过5000种逼真的AI语音。
Narrai
Narrai
Narrai是一款AI驱动的移动应用,通过自动生成相关剧本并提供多种叙述者角色,即时为短视频创建语音旁白和背景音乐。
Vagent
Vagent
Vagent是一个轻量级的语音接口,使用户可以通过语音命令与自定义AI代理互动,提供了一种自然和直观的方式来控制自动化,支持60多种语言。
F5 TTS
F5 TTS
F5-TTS 是一种最先进的非自回归文本转语音系统,使用 Flow Matching 和 Diffusion Transformer 技术生成高度自然和富有表现力的语音,具有零样本语音克隆功能。