Skip to content

Feige-cn/AI_reader

Repository files navigation

AI读书

效果展示:

夸克网盘「皮囊_曹操.wav」

夸克网盘「皮囊_女儿国国王.wav」

基于Maskgct做的AI读书项目。

给我一本电子书,再给一段参考音频,直接生成特定声音的讲书音频。

书籍阅读部分支持本地Ollama和外部API,这里主要是考虑一般情况下外部API那些所谓的满血版大语言模型确实能力更强,而且更重要的是现在API都是白菜价,不,可能比白菜更便宜。而本地Ollama如果不能用到14B以上的模型,那阅读能力真是难以评价,我本地的Ollama最大也就能运行14B的Deepseek,效果只能说还行。 语音合成部分采用Maskgct,实际测试中有6G显存就够了,低于6G显存未测试。

项目流程图

项目流程图

界面图

环境自检

技术交流:

知识星球【AI改变生活】 微信

About

文字+语音模型实现AI读书,可定制音色。

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published