2011年7月27日 星期三

ePub 基本架構說明

1.什麼是ePub?

「ePub」格式,是由國際數位出版論壇(IDPF)所提出的:用類似網頁的XML架構,讓電子書的文字可以在不同的電子閱讀設備進行內容重排的數位出版品內容組織與應用規範。

強調的是同一文字在不同閱讀器的共通性,捨棄掉紙本書的設計及樣子,在不同閱讀器上正確呈現內容是ePub的主要目的。


2.ePub檔案其實是一個壓縮檔

它其實是一個zip壓縮檔,把要形成ePub的檔案在不要用資料夾裝起來的狀況之下,全部用壓縮軟體壓縮成.zip檔案之後,接著將附檔名從.zip改成.epub就變成了ePub檔。



因為ePub是個壓縮檔,所以如果我們拿到一個ePub檔的時候,可以

(a)先把附檔名從.epub改成.zip。

(b)然後用普通的解壓縮軟體解壓縮,就可以看到ePub裡面的檔案。



3.ePub檔和網頁檔有關

打開壓縮檔之後會發現有很多網頁html的檔案。其實基本上ePub檔就是就是很多網頁檔的結合。想像之前看網頁的時候,調整瀏覽器大小,有時網頁的字也會跟著縮放。在電子書的設計上,就是採用了這種特性。



4.ePub的架構

ePub的格式包括了三個部分:由OCF、OPS及OPF三個部分組成了一個ePub檔案。



5.什麼是OCF (Open Container Format) 開放容器格式

OPF是ePub壓縮及封包的規範,簡單的來說,就是規範ePub用壓縮軟體,壓成.zip檔。



6.什麼是OPF (Open Packaging Format) 開放包裝格式

OPF是ePub負責導覽和目錄的部份。可以說是一個電子書裡的「根檔案」。

紀錄著這本電子書裡的封面、目錄、前言、各章節的html連結。

其中包括了

(a) metadata:原資料,也就是書籍資料。紀錄了書籍的相關資訊,好像版權頁一樣。

(b) manifest:(電子書內容物)清單:包括檔案名稱和id連結。(id=”檔案”)

(c) spine:控制閱讀的順序。調整ID會改變電子書裡章節出現的順序。

(d) guide:導讀部分,負責輔助閱讀的構造。比方說給盲人的有聲書部分。

(e)在OPF之外常常會看到toc.ncx,這個是給程式讀的目錄檔案。



7.什麼是OPS (Open Publication Structure) 開放出版架構

OPS是一個電子書主要的內容及標記部分。也是我們製作電子書主要要處理的部份。先前提到的XML的架構,就是指在這邊出現的內容,是以XML的格式出現的。XML格式的文件,意思就是我們在本來的內文裡下標記,讓電腦知道哪些文字是標題,哪些文字是小標題,及哪些文字是內文等等…。



8.再次說明ePub架構

如上圖示,先有最底層的OPS內容,然後再透過OPF負責導覽和目錄的部份。最後再以OCF規範用zip壓縮檔案,就變成了ePub檔。



有時候在比較新的ePub生成工具裡,OPF和OPS會合成一個資料夾,叫做OEBPS。不過不管怎麼樣,在內容上面,ePub包括了:

(a).opf檔

(b).ncx檔

(c) 內容html檔

(d) 附加插圖的圖檔

(e) META-INF資料夾,裡面有container.xml檔案,告訴電子閱讀機器要去哪裡讀OPF檔案。



9.開發ePub需要的相關軟體

開發ePub電子書需要的軟體包括了:

2.1 ePub電子書製作工具:eCub、Calibre、Adobe InDesign CS5

2.2 ePub電子書閱讀工具:Adobe digital edition、Sony eLibrary、Calibre…

2.3 ePub電子書編輯工具:PDFXML Inspector、SIGIL


參考資料:http://tw.myblog.yahoo.com/jw!bk8ATBWWGiiYAJe366FuXAC9zSo-/article?mid=10699

沒有留言: