Introduction to image processing in Digital Libraries

　　一個數位圖書館及博物館的設計與建構，跟他所收藏的物品及書籍有非常密切的關係，因為館藏物決定了這個圖書及博物館的風格與特色。但不論在哪種類型的數位圖書及博物館中，都會有影像的資料，但每種類型的數位圖書及博物館對於影像處理的需求，因著圖書及博物館的特色而各異。首先我們就看看，在一般的數位圖書及博物館中，有哪些影像的資料。

◎What image data does a digital library have?

　　在一個數位圖書館中，有哪些影像的資料呢？大致而言有以下幾種資料：

手寫的資料 (可能希望以影像的方式儲存，如古文書）
圖片及插圖
照片
地圖及其他的地理資料影像
錄影的影像

一般的數位圖書及博物館，主要以前三項為主。樣台大的數位圖書及博物館，就是以古文書，些許的圖片及照片為主，再加上一些地圖的資料。但也有一些數位圖書館，是專門針對某些領域的影像處理而設置的，如： Alexandria Digital Library at UCSB Santa Barbara，就是以一些地理的資料為主，故有許多的地圖、飛機的高空照片﹍等，故其在影像處理的需求上，就較一般的數位圖書及博物館有一些差異，正因為影像的資料量大，故非常需要影像搜尋及擷取的功能。另外像是： Informedia Digital Video Library at Carnegie Mellon University，是一個以影片為主的數位圖書館，他們對於影像處理的需求，有是有其獨到的地方。在這篇報告中，將會對 Alexandria Digital Library 的影像搜尋，及 Informedia Digital Video Library 的影像檢索作詳細的說明。以下，就先來認識一下這幾個數位圖書館的概況。

◎Informedia Digital Video Library

The Informedia project is developing new technologies for data storage , search, and retrieval, and embedding them in a video library system for use in education, training, sports and entertainment.

◎Alexandria Digital Library

◎UC Berkeley Digital Library

The project's goal is to develop the technologies for intelligent access to massive, distributed collections of photographs, satellite images, maps, full text documents, and "multivalent" documents.
Their Collections:
- Environmental Documents
- Photographs (over 58,000 images available for online searching)
- Aerial Photos (from 97 flightlines)
- Geographic Data (Geographic Information System images)
- Botanical Datasets (Over 11,000 images of California plants)

　　當我們知道有這麼多的影像資料存在於數位圖書館中後，我們為什麼需要影像處理的技術呢？我們對這些影像有什麼需求呢？

◎Why Image processing is necessary in a Digital Library?

We want to store image data.
We want to enhance image data.
We want to restore image data.
- because of damaged Original image
- because of imperfect acquisition
We want to find a special image in a lot of image data.
We want to let others know“This image is ours.”

　　我們希望能有很節省空間的影像儲存方式。我們希望能對影像作一些修改，使修改後的影像更符合我們的需求。我們希望能修補影像，使影像能回復他原本的風貌；這是因為，有些物品、繪畫或是手稿可能太過古老，以致影像變得相當不清晰，或者也可能因為攝影的工具的不良，而造成影像的缺陷。
　　當所有的影像的儲存好後，我們便希望能夠很快的存一大筆的影像資料中找到我們想要的那張圖片，或者我們可能也希望能有很好了分類，以方便影像的擷取與整理。
　　最後，當所有的功能都齊全後，一個數位圖書館也可能希望讓所有的使用者都知道這張影像是屬於本館的，當有人盜用時，我們有辦法能夠證明這個影像的確是我們數位圖書館的館藏。
　　以上這些，都使得影像處理，成為數位圖書館的建構中不或缺的一環。

　　既然影像處理是必須的，我們就來看看影像處理的本原件。

◎Basic Components of Image Processing Digital Library?

　　物品、手稿、照片或是地圖這些原始資料，必須要先經過影像擷取 (Image Acquisition) 的過程，才能變成數位的影像資料；這個過程可能是透過數位相機，或是掃描器 (Scanner) 將原始的物品轉換成數位的影像。
　　接下來，我們便可以對這些影像的資料做一些修改與修補的工作，最後運用壓縮的技巧將影像儲存在電腦的硬碟之中。如此，便完成了數位圖書館影像處理的初步工作。
　　若影像的資料量不大，也沒有影像搜尋的必要性，那麼影像處理的工作到這裡便算是完成了。但是，若我們有一大筆的影像資料，或者我們希望在數位圖書館的影像資料中，能夠讓使用者很快的找到他要的那張圖片，影像處理的下一步工作就必須開始進行了。
　　於是，我們便需要去辨識我們影像資料中的一些物件，及這些影像的特色，例如：這張圖面中有一輛黃色的四門轎車。當然這樣的辨識工作可以是由人進行，但我們也可以用一些人工智慧的技術讓電腦學著來做。這是一項很不容易的工作，目前的技術也沒有好到跟人一樣，所以大部份的解決方案是，先用電腦辨識，再由人決定是否正確，或需要修正。
　　辨識出物件後，我們便要把每一個物件的特徵表示成電腦看得懂得語言，存在硬碟中。當以後使用者想要尋找有某些特徵的圖片時，便可以藉由這些已存在於電腦中特徵來找到使用者想要的圖片。這個領域通常可以稱為 Image Retrieval, Image Database 或是 Content-based Database.