Balabolka的名称源自俄语,意为“喋喋不休”。软件基于微软语音API(SAPI)开发,支持调用Windows系统中安装的所有SAPI 4、SAPI 5及Microsoft Speech Platform语音引擎,所有语音合成均在本地完成,无需联网即可运行

功能类别说明
完全免费个人使用无需付费,可无限次转换文本为音频,无广告干扰
离线运行不依赖网络连接,所有语音合成均在本地完成,保护隐私安全
多格式支持可直接读取TXT、DOC、DOCX、PDF、EPUB、FB2、HTML、CHM、MOBI、ODT等20余种文档格式
丰富导出格式支持WAV、MP3、MP4、OGG、WMA等多种音频格式,可调节比特率和采样率
语音参数可调支持语速、音调、音量等精细调节
发音规则自定义通过替换列表或正则表达式纠正特定词汇的发音
便携版可用提供绿色便携版本,无需安装即可运行
命令行支持提供控制台工具balcon.exe,支持脚本化批量调用
同步文本显示可将同步文本保存为LRC文件或嵌入MP3标签中
SSML支持支持语音合成标记语言,实现停顿、重音等高级语音控制

准备工作

  • 访问Balabolka官方网站,点击下载按钮获取安装包。
  • 运行安装程序,选择安装语言(建议选择“简体中文”)。若弹出“Windows已保护你的电脑”提示,点击“更多信息”→“仍要运行”。
  • 点击“下一步”,选择安装路径(建议保持默认),并建议勾选“创建桌面快捷方式”。
  • 点击“安装”,等待进度条完成。
  • 安装完成后点击“完成”,Balabolka会自动启动。

便携版

除安装版外,Balabolka还提供绿色便携版。下载后解压即可直接运行,无需安装,配置信息保存在软件文件夹中,适合放在U盘随身携带。

首次启动与中文界面确认

安装时选择简体中文后,菜单栏即为中文显示。若界面为英文,可通过以下方式切换:

  • 点击菜单栏 View(视图) → Language(语言),选择“中文(简体)”。
  • 重启软件即可生效。

界面概览

本段介绍软件主界面的布局分区、状态指示灯含义以及支持的文件格式,帮助用户快速熟悉操作环境。

主界面概览

Balabolka的界面设计简洁直观,各功能区域划分清晰,便于快速上手。

区域说明
菜单栏位于窗口最上方,包含文件、编辑、查看、语音、工具等主菜单
工具栏位于菜单栏下方,提供常用功能快捷图标(打开、保存、播放、暂停、停止等)
语音参数调节区位于工具栏上方或右侧面板,包含语速、音调、音量滑块,实时调整
语音选择区在语音菜单栏中可选已安装的语音引擎和音色
文本编辑区占据界面主体,用于输入或粘贴待朗读/转换的文本内容
状态栏位于窗口底部,显示当前语音引擎、文件信息及播放状态

基础操作

本段讲解导入文本、选择语音、调节参数、朗读及保存音频的基础操作,让用户快速上手。

导入文本内容

Balabolka支持多种方式导入文本,可根据实际需求灵活选择。

操作步骤
  • 方法一:直接粘贴文本:复制任意文本(Ctrl+C),在Balabolka文本编辑区右键选择“粘贴”(Ctrl+V),文本立即显示。
  • 方法二:打开文件:点击菜单栏“文件”→“打开”(Ctrl+O),选择支持的文件格式(TXT、DOCX、PDF、EPUB、HTML、RTF、CHM等),点击“打开”,文件内容自动加载。
  • 方法三:拖拽文件:直接将文件从文件夹拖拽到Balabolka窗口,即可自动打开。
  • 方法四:监控剪贴板:点击菜单栏“工具”→“选项”,勾选“监控剪贴板”。之后每次复制文本,Balabolka会自动粘贴内容,无需手动切换窗口。

选择语音引擎

  • 点击顶部菜单栏 “语音” ,在下拉列表中可查看当前可用的语音引擎。
  • 选择所需的语音(如Microsoft Lili – Chinese(China)为中文语音)。
  • 若无可用的中文语音,需在Windows系统中添加语音包(详见第九部分“语音管理”)。

调整语音参数

在软件界面中找到语速、音调、音量滑块,可实时调节。

参数调节范围推荐设置
语速-10(最慢)至 +10(最快)正常阅读选3-5,学习选0-2
音调-10(低沉)至 +10(尖锐)默认0,可根据喜好微调
音量0-100建议70-90

调节后点击工具栏“朗读”按钮实时预览效果,反复调整直到满意。

开始朗读

在软件中朗读文本有以下两种方式:

  • 朗读全部文本:确保文本已加载,点击工具栏的“朗读”按钮(播放图标▶️),软件从光标位置开始朗读,当前朗读的句子会高亮显示。
  • 朗读选定文本:用鼠标选中要朗读的段落,点击“朗读”按钮,只朗读选中部分,适合反复听取重点段落。

保存为音频文件

将文本转换为音频文件是Balabolka的核心功能之一,尤其适合制作有声书。

  • 确保文本已加载,语音引擎和参数已调好。
  • 点击菜单栏 “文件”→“保存音频文件” (或按Ctrl+V)。
  • 在弹出的对话框中,选择音频格式(推荐MP3,兼容性最好)。
  • 点击“设置”按钮可调整比特率和采样率(默认128kbps、44.1kHz即可)。
  • 选择保存路径、输入文件名,点击“保存”。
  • 软件开始转换,进度条显示状态,完成后打开保存路径即可试听。

语音管理

本段介绍SAPI语音引擎的工作原理,帮助用户为软件添加更多语音资源。

SAPI简介

SAPI(Speech Application Programming Interface)是微软设计的语音功能软件接口,Windows XP及之后的版本均使用SAPI 5。Balabolka对SAPI 4和SAPI 5均有良好的兼容性。

查看已安装的语音

在Windows控制面板中查看:进入“控制面板”→“语音”→“语音属性”→“文本转语音”→“语音选择”。也可通过Balabolka菜单栏“语音”下拉框直接查看。

添加更多语音

Balabolka本身不包含语音引擎,需通过Windows系统添加。

操作步骤
  • 通过Windows设置添加:进入“设置”→“时间和语言”→“语音”→“管理语音”→“添加语音包”,搜索所需语言并下载。
  • 安装第三方TTS引擎:支持Cepstral、NeoSpeech、RHVoice等第三方SAPI兼容语音引擎。
  • Microsoft Speech Platform:下载安装Microsoft Speech Platform SDK和对应语音资源(需安装32位版本)。

进阶操作

本段讲解自定义替换列表、SSML标记语言、批量处理、同步文本等高级功能。

自定义替换列表(发音纠正)

对于专有名词、缩写或外来词,可通过替换列表纠正发音。

操作步骤
  • 点击菜单栏 “工具”→“替换列表”
  • 添加替换规则,例如查找“Wi-Fi”,替换为“Wai Fai”。
  • 朗读时,Balabolka会自动替换发音。
  • 支持VBScript正则表达式语法,实现更精确的发音控制。

SSML语法支持

SSML(Speech Synthesis Markup Language)允许在文本中插入控制标签,实现更精细的语音控制。

  • <break time="500ms"/>:插入500毫秒停顿
  • <emphasis level="strong"/>:加重音强调
  • <prosody rate="x-slow">...</prosody>:局部变速

插入停顿

在文本中直接插入[pau=500](数字表示毫秒),例如:“快跑![pau=500]他喊道。”

批量处理文件

如需同时转换多个文本文件:

  • 点击菜单栏 “文件”→“批量处理”
  • 添加多个文本文件。
  • 统一设置语音参数和音频格式。
  • 一键批量转换。

同步文本(歌词效果)

Balabolka可将同步文本保存在外部LRC文件或MP3标签中。当音频在支持LRC的播放器上播放时,文本会同步显示(如同歌词)。

更改界面皮肤

Balabolka支持界面皮肤功能。下载皮肤文件(.zip格式)后,解压放置于安装目录的skins文件夹中,重启软件后通过“查看”→“皮肤”选择即可。

OCR文字识别

Balabolka可通过插件实现OCR文字识别功能,适用于扫描版PDF等图片格式文档。需搭配Tesseract OCR引擎使用。

命令行参数

本段介绍balcon.exe的使用方法,满足开发者和高级用户的自动化需求。

Balabolka附带命令行实用工具balcon.exe,无图形界面,适合通过脚本实现自动化文本转语音。

基础语法

balcon [选项 ...]

所有参数之间用空格分隔,选项可按任意顺序出现。使用balcon -?可查看完整的帮助信息。

常用参数

参数说明示例
-l列出所有可用语音名称及语言IDbalcon -l
-g列出所有可用音频输出设备balcon -g
-f 文件名指定输入文本文件balcon -f mytext.txt
-w 文件名指定输出WAV音频文件balcon -f mytext.txt -w output.wav
-n 语音名称指定语音名称balcon -n "Microsoft Lili"
-id 数字指定语言ID(如1033表示英语-美国)balcon -id 1033
-c从剪贴板获取文本输入balcon -c -w clip.wav
-t “文本”从命令行直接获取文本输入balcon -t "你好世界" -w hello.wav
-s 数值SAPI 5:设置语速(范围-10至10)balcon -s 2
-p 数值SAPI 5:设置音调(范围-10至10)balcon -p 1
-vo 数值设置音量(范围0至100)balcon -vo 80
-br 比特率设置MP3比特率(kbps)balcon -br 128
-sr 采样率设置采样率(Hz)balcon -sr 44100

使用示例

# 列出所有可用语音
balcon -l

# 将TXT文件转换为WAV格式
balcon -f "C:\mytext.txt" -n "Microsoft Lili" -s 0 -p 0 -w "C:\output.wav"

# 从剪贴板获取文本转换为MP3
balcon -c -w "D:\clipboard.mp3"

# 直接转换命令行中的文本
balcon -t "这是Balabolka命令行测试" -w "C:\test.mp3"

# 批量转换当前目录下的所有TXT文件
for %i in (*.txt) do balcon -f "%i" -w "%~ni.mp3"

常见问题

本段列出用户经常遇到的问题及其解决方法,帮助快速排障。

Q1:Balabolka需要联网吗?

A:不需要。Balabolka调用Windows系统已安装的离线语音引擎,所有语音合成均在本地完成,无需联网即可运行。

A:通过Windows添加:进入“设置”→“时间和语言”→“语言”,添加“中文(简体)”,然后进入“语音”设置下载中文语音包。完成后重启Balabolka,中文语音便会出现在语音选择列表中。

A:Balabolka使用临时WAV文件处理,文件大小限制为4GB。音频文件的最长持续时间取决于采样率、位分辨率和声道数。建议将大型文档拆分为可管理的部分。

Balabolka是由俄罗斯开发者Ilya Morozov打造的一款基于微软语音API(SAPI)的免费文本转语音(TTS)程序。它支持调用Windows系统中安装的所有语音引擎,无需联网即可离线运行,可将各类文档转换为语音并导出为MP3等音频格式,广泛应用于有声书制作、外语学习、无障碍辅助阅读及教学课件配音等场景

© 版权声明
评论 抢沙发

请登录后发表评论

    暂无评论内容