旗下產業(yè): A產業(yè)/?A實習/?A計劃
全國統(tǒng)一咨詢熱線:010-5367 2995
首頁 > 熱門文章 > 大數(shù)據(jù)分析 > 如何使用Python將PDF文檔轉為MP3音頻

如何使用Python將PDF文檔轉為MP3音頻

時間:2020-12-23來源:lb577.com點擊量:作者:Sissi
時間:2020-12-23點擊量:作者:Sissi



一、轉語音工具
 

  微信讀書里的電子書有配套的自動音頻,而且聲音優(yōu)化的不錯,比傳統(tǒng)的機械朗讀聽起來舒服很多。
 

  記得之前看到過Python有一個工具包,可以將文字轉換為語音,支持英文和中文,而且能調節(jié)語速語調、導出mp3等。
 

  去Github查了下,這個庫叫:pyttsx3
 

如何使用Python將PDF文檔轉為MP3音頻
 

  簡單來說,pyttsx3可以文字轉語音,且是離線工作的,這一點就很實用。
 

  安裝比較容易,直接在命令行用pip安裝:
 

如何使用Python將PDF文檔轉為MP3音頻
 

  我準備動手試試,將PDF書籍轉成音頻。
 

  用什么書呢?最近在群里看到有人發(fā)張磊的新作《價值》電子書,這本今年剛出的暢銷書盜版猖獗,我之前在微信讀書里看過,對作者長期主義的觀點深信不疑。
 

二、PDF轉文本
 

  既然是把PDF轉化成語音,肯定是需要先讀取PDF中的文字,再利用pyttsx3轉語音。
 

  Python中操作PDF的工具庫主要是PyPDF2,但發(fā)現(xiàn)編碼實在有點繁瑣,我就換了另一個庫pdfplumber,與PyPDF2語法類似,用起來還算流暢。
 

  pdfplumber可以處理PDF包括文本、表格、格式在內的各種信息,小而強大。
 

如何使用Python將PDF文檔轉為MP3音頻
 

  輸出:
 

如何使用Python將PDF文檔轉為MP3音頻
 

  上面的代碼做了幾件事情:「讀取PDF文檔、讀取頁數(shù)、讀取第4頁、輸出第4頁文本」
 

三、文本轉語音
 

  接下來開始將第4頁的文本轉化為音頻。

如何使用Python將PDF文檔轉為MP3音頻
 

  上面代碼使用pyttsx3將文本轉化為音頻,然后朗讀出來。我是在jupyter notebook上做實驗的,代碼執(zhí)行后,電腦會直接朗讀。
 

  也可以將生成的音頻保存為mp3格式。

如何使用Python將PDF文檔轉為MP3音頻
 

  當然你還可以調整聲音的類型、速度、大小。
 

如何使用Python將PDF文檔轉為MP3音頻



 

預約申請免費試聽課

填寫下面表單即可預約申請免費試聽!怕錢不夠?可先就業(yè)掙錢后再付學費! 怕學不會?助教全程陪讀,隨時解惑!擔心就業(yè)?一地學習,可推薦就業(yè)!

?2007-2021/北京漫動者教育科技有限公司版權所有
備案號:京ICP備12034770號

?2007-2022/ lb577.com 北京漫動者數(shù)字科技有限公司 備案號: 京ICP備12034770號 監(jiān)督電話:010-53672995 郵箱:bjaaa@aaaedu.cc

京公網安備 11010802035704號

網站地圖