一、轉(zhuǎn)語音工具
微信讀書里的電子書有配套的自動(dòng)音頻,而且聲音優(yōu)化的不錯(cuò),比傳統(tǒng)的機(jī)械朗讀聽起來舒服很多。
記得之前看到過Python有一個(gè)工具包,可以將文字轉(zhuǎn)換為語音,支持英文和中文,而且能調(diào)節(jié)語速語調(diào)、導(dǎo)出mp3等。
去Github查了下,這個(gè)庫叫:pyttsx3
簡單來說,pyttsx3可以文字轉(zhuǎn)語音,且是離線工作的,這一點(diǎn)就很實(shí)用。
安裝比較容易,直接在命令行用pip安裝:
我準(zhǔn)備動(dòng)手試試,將PDF書籍轉(zhuǎn)成音頻。
用什么書呢?最近在群里看到有人發(fā)張磊的新作《價(jià)值》電子書,這本今年剛出的暢銷書盜版猖獗,我之前在微信讀書里看過,對作者長期主義的觀點(diǎn)深信不疑。
二、PDF轉(zhuǎn)文本
既然是把PDF轉(zhuǎn)化成語音,肯定是需要先讀取PDF中的文字,再利用pyttsx3轉(zhuǎn)語音。
Python中操作PDF的工具庫主要是PyPDF2,但發(fā)現(xiàn)編碼實(shí)在有點(diǎn)繁瑣,我就換了另一個(gè)庫pdfplumber,與PyPDF2語法類似,用起來還算流暢。
pdfplumber可以處理PDF包括文本、表格、格式在內(nèi)的各種信息,小而強(qiáng)大。
輸出:
上面的代碼做了幾件事情:「讀取PDF文檔、讀取頁數(shù)、讀取第4頁、輸出第4頁文本」
三、文本轉(zhuǎn)語音
接下來開始將第4頁的文本轉(zhuǎn)化為音頻。
上面代碼使用pyttsx3將文本轉(zhuǎn)化為音頻,然后朗讀出來。我是在jupyter notebook上做實(shí)驗(yàn)的,代碼執(zhí)行后,電腦會(huì)直接朗讀。
也可以將生成的音頻保存為mp3格式。
當(dāng)然你還可以調(diào)整聲音的類型、速度、大小。
填寫下面表單即可預(yù)約申請免費(fèi)試聽!怕錢不夠?可先就業(yè)掙錢后再付學(xué)費(fèi)! 怕學(xué)不會(huì)?助教全程陪讀,隨時(shí)解惑!擔(dān)心就業(yè)?一地學(xué)習(xí),可推薦就業(yè)!
?2007-2022/ m.lb577.com 北京漫動(dòng)者數(shù)字科技有限公司 備案號(hào): 京ICP備12034770號(hào) 監(jiān)督電話:010-53672995 郵箱:bjaaa@aaaedu.cc