當網頁開啟PDF,左上方的頁籤變亂碼,如何處理?
當網頁開啟PDF,左上方的頁籤變亂碼,如何處理?
當我們四處逛網站時,您是否曾遇到網頁中的PDF檔案開啟時,瀏覽器的左上方的標籤名稱,竟然出現一排亂碼? 這時候,直覺網頁沒寫好。其實,這樣的認知只對一半,出現這亂碼主要是檔案轉成PDF的過程中,元資料(metadata)出錯,造成的原因可能和轉檔的軟體太老舊有關,和網頁語技術語法一點關係都沒有。那麼寫網頁的人就沒錯囉? 也不能這樣解釋,因為網頁的輸出結果就是他的工作結果,沒有追根究底想辦法解決,讓問題繼續存在,那就是要承擔疏忽。
然而,PDF元資料是什麼?
PDF元資料(metadata)
PDF檔案可包含兩種類型的元資料。第一種是文件資訊字典,一套像作者、標題、主題、建立及更新日期的關鍵字/值欄位。這儲存於可選的檔案尾部。有一小組欄位是有定義的,而且如果有需要,可以用附加的文字欄位擴充。
後來在PDF 1.4中,對元資料流的支援被加入,用可延伸元資料平台(XMP)來添加像在其他檔案格式那樣的基於XML標準的可延伸的元資料。這允許元資料附加到文件中的任何字串流,諸如關於嵌入式插圖的說明,以及整個文件(附加到文件目錄),使用可延伸的綱要。
(註: PDF元資料說明,來自維基百科)
怎麼檢視PDF文件的元資料?
使用adobe reader軟體開啟pdf檔案,點擊左上方檔案中的內容,即可看到如下圖視窗:
其中在標題的位置,出現亂碼,而這個就是顯示在瀏覽器左上方標籤的亂碼。可是,在adobe reader是無法編輯和修改的。
如何修改PDF的元資料以解決問題?
1. 使用購買的adobe acrobat軟體
-
請選擇「檔案 > 內容」,按一下「描述」標籤,然後按一下「其它元資料」。
-
請從左邊的清單中選擇「進階」。
-
要編輯元資料,請執行以下任一動作,然後按一下「確定」。
優點: 商業軟體、功能齊全。
缺點: 昂貴的費用。
2. 使用線上編輯PDF元資料網頁服務 PDFCandy
每個月支付6美元,可以更改44個PDF檔案。操作很方便,上傳>執行更改>下載就完成。
優點: 雲端處理、操作方便。
缺點: 雖然付費,當月還是有數量限制。
3. 使用Linux指令進行無限制修改
先安裝exiftool 和 libimage-exiftool-perl
sudo apt install exiftool libimage-exiftool-perl
然後如果您有一個名為 myhouse.pdf 的檔案,要更改它的元資料,請依照以下方式進行指令動作
exiftool -Title="這裡填標題名稱" -Author="Wanding Kuo" -Subject="PDF Metadata" myhouse.pdf
- Title :填入正確的標題名稱
- Author: 作者的名字
優點: 完全自由、想改就改。
缺點: 雖然免費又無限制,但是需要熟悉Linux指令操作
結論
雖然是個小問題,不會引起人們的注意。但是,對網頁生產者來說,就是會常常遇到。透過搜尋,資料並不多,於是我們整理成這篇文,並公開分享。如果您有遇到這方面問題而無法解決,歡迎利用網站的聯絡表單留下訊息,我們會盡快回覆您。