Thư viện - Chương 4: Bộ sưu tập và biên mục tài liệu số
Một sưu tập - collection: tập trung vào đối tượng số hóa, bao
gồm văn bản, hình ảnh và âm thanh cùng với phương thức truy cập,
truy hồi, chọn lọc, tổ chức, bảo trì sưu tập đó. Sưu tập do chuyên gia
thư viện tạo nên. Một sưu tập - collection thông tin bao gồm nhiều tài
liệu dưới nhiều hình thức.
Một tài liệu - document: là thông điệp mang thông tin dưới hình
thức điện tử. Tài liệu là đơn vị cơ sở từ đó bộ sưu tập thông tin được
xây dựng, mặc dù chúng có thể có những cơ sở hạ tầng và những tập
tin kết hợp riêng. Nói chung tài liệu bao gồm văn bản, hình ảnh, âm
thanh hay video.
Một bộ sưu tập thông tin: là một sưu tập bao gồm nhiều tài liệu
dưới nhiều dạng thức khác nhau: văn bản, hình ảnh, âm thanh, hình
ảnh động, tuy nhiên cung cấp một giao diện đồng nhất qua đó tất cả
các tài liệu có thể được truy cập, mặc dù cách mà tài liệu đó hiển thị sẽ
tuỳ thuộc vào phương tiện và dạng thức của tài liệu đó. Ví dụ muốn
đọc một văn bản PDF thì phải tích hợp trình ứng dụng Adobe Acrobat
hay muốn xem một đoạn video thì phải tích hợp trình ứng dụng
Windows Media Player,
Tóm tắt nội dung tài liệu: Thư viện - Chương 4: Bộ sưu tập và biên mục tài liệu số
CHƯƠNG 4. BỘ SƯU TẬP VÀ BIÊN MỤC TÀI LIỆU SỐ 113 Chương 4 BỘ SƯU TẬP VÀ BIÊN MỤC TÀI LIỆU SỐ 1. CÁC KHÁI NIỆM Một sưu tập - collection: tập trung vào đối tượng số hóa, bao gồm văn bản, hình ảnh và âm thanh cùng với phương thức truy cập, truy hồi, chọn lọc, tổ chức, bảo trì sưu tập đó. Sưu tập do chuyên gia thư viện tạo nên. Một sưu tập - collection thông tin bao gồm nhiều tài liệu dưới nhiều hình thức. Một tài liệu - document: là thông điệp mang thông tin dưới hình thức điện tử. Tài liệu là đơn vị cơ sở từ đó bộ sưu tập thông tin được xây dựng, mặc dù chúng có thể có những cơ sở hạ tầng và những tập tin kết hợp riêng. Nói chung tài liệu bao gồm văn bản, hình ảnh, âm thanh hay video. Một bộ sưu tập thông tin: là một sưu tập bao gồm nhiều tài liệu dưới nhiều dạng thức khác nhau: văn bản, hình ảnh, âm thanh, hình ảnh động, tuy nhiên cung cấp một giao diện đồng nhất qua đó tất cả các tài liệu có thể được truy cập, mặc dù cách mà tài liệu đó hiển thị sẽ tuỳ thuộc vào phương tiện và dạng thức của tài liệu đó. Ví dụ muốn đọc một văn bản PDF thì phải tích hợp trình ứng dụng Adobe Acrobat hay muốn xem một đoạn video thì phải tích hợp trình ứng dụng Windows Media Player, NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ 114 Hình 4.1: Ví dụ minh họa về một bộ sưu tập bằng phần mềm Greenstone Một bộ sưu tập như thế trước khi trình bày phải qua một quá trình hình thành để tạo nên những cấu trúc hỗ trợ cho việc truy tìm và lướt tìm được dùng cho việc truy cập sưu tập. Khi xây dựng xong, bộ sưu tập có thể được xuất bản trên Internet hoặc xuất ra CD-ROM một cách hoàn toàn tự động. Một khi sưu tầm thêm tài liệu mới, ta có thể dễ dàng bổ sung thêm vào bộ sưu tập bằng cách tái xây dựng. Một thư viện nói chung bao gồm nhiều bộ sưu tập khác nhau, mỗi sưu tập tổ chức mỗi khác, tùy theo hình thức tài liệu được sưu tầm và tùy theo chủ đề, đề tài được quan tâm; tuy nhiên hoàn toàn giống nhau về phương cách xây dựng và hiển thị. CHƯƠNG 4. BỘ SƯU TẬP VÀ BIÊN MỤC TÀI LIỆU SỐ 115 Hình 4.2: Ví dụ minh họa về một bộ sưu tập bằng phần mềm Dspace Những chuyên viên thư viện số trong một thư viện với sự phối hợp và tương tác với người sử dụng sẽ tạo nên những bộ sưu tập cần thiết và hữu ích cho thư viện, phục vụ tốt công tác nghiên cứu, giảng dạy, học tập trong những cơ sở đào tạo; đồng thời đáp ứng nhu cầu khảo cứu của học giả, nhà nghiên cứu và nhiều đối tượng khác. Đây là công việc thường xuyên của một thư viện đòi hỏi chuyên viên thư viện số phải phối hợp với bộ phận Dịch vụ thông tin để nắm bắt yêu cầu thông tin của người sử dụng nhằm phục vụ tốt cho việc sưu tầm thông tin; có kỹ năng số hóa tài liệu; am hiểu chuẩn Dublin Core trong công tác biên mục tài nguyên; và nhất là thành thạo trong việc sử dụng phần mềm nguồn mở Greenstone. 2. Ý NGHĨA VÀ NHU CẦU Thế giới thư viện ngày nay đang trải qua một giai đoạn thay đổi lớn. Các thư viện đại học và thư viện nghiên cứu đang đối mặt với sự phát triển mới. Cùng với sự phát triển việc sử dụng các công nghệ NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ 116 mới, sự gia tăng thông tin số dưới dạng xuất bản phẩm điện tử và nguồn tin trên mạng, cũng như sự có mặt Internet ở khắp mọi nơi. Thực tế, việc phát triển CNTT và truyền thông đã và đang giúp cho đội ngũ giảng viên ngày càng nâng cao và cập nhật kiến thức chuyên môn. Tuy nhiên thông tin ngày càng trở nên quá tải. Trách nhiệm của những người làm công tác quản lý thông tin trong một trường đại học là làm thế nào để giúp cho đội ngũ giảng viên, sinh viên và cán bộ có được những thông tin có ý nghĩa và hữu ích để họ thật sự có thể nâng cao và cập nhật kiến thức chuyên môn, phục vụ công tác giảng dạy, học tập và nghiên cứu khoa học. Một nhu cầu về lưu trữ, tổ chức và truy cập thông tin đã và đang đặt các thư viện trước ngưỡng cửa của thư viện số. Thông tin cần được chọn lọc, tổ chức và phục vụ dưới dạng kỹ thuật số. Để làm được điều đó việc xây dựng, phát triển các bộ sưu tập số cần phải có một kế hoạch, một chiến lược phát triển lâu dài. Sau đây là một số bước tạo lập bộ sưu tập thông tin: - Xác định các loại tài liệu cần thiết trong một lĩnh vực cụ thể hay trong toàn bộ sưu tập. - Đối chiếu tính xác đáng, mức độ yêu cầu của tài liệu nhằm đảm bảo sự chọn lựa tốt nhất đã được thực hiện mà không vượt quá kinh phí cho phép. - Số hóa các tài liệu được chọn với giá hợp lý theo phương cách hiệu quả nhất. - Đóng gói các tài liệu số thành các bộ sưu tập và phân phối các bộ sưu tập tới đông đảo bạn đọc. Toàn bộ quá trình phải tập trung vào việc cung cấp tài liệu đáp ứng nhu cầu thông tin đã được xác định và phù hợp, gắn liền với hoạt động của thư viện trong quá trình xác định vai trò, nhiệm vụ, mục tiêu hoạt động của mình. Chính vì vậy mà phát triển bộ sưu tập không thể là một yếu tố hay quá trình đơn lẻ; mà ngược lại nó cần được đặt trong mối quan hệ chung mà ở đó nhu cầu sử dụng của các nhóm đối tượng CHƯƠNG 4. BỘ SƯU TẬP VÀ BIÊN MỤC TÀI LIỆU SỐ 117 người dùng, cũng như mối tương quan với các quan hệ bên ngoài cần phải được xác định và thỏa mãn. 3. MỘT SỐ BỘ SƯU TẬP MẪU Như khái niệm đã đề cập, một bộ sưu tập thông tin là một sưu tập bao gồm nhiều tài liệu dưới nhiều dạng thức khác nhau: văn bản, hình ảnh, âm thanh, hình ảnh động...; dưới đây là một số bộ sưu tập mẫu được thể hiện theo các dạng thức khác nhau; phần lớn các bộ sưu tập mẫu này được xây dựng bằng phần mềm nguồn mở Greenstone. 3.1. Các bộ sưu tập theo loại hình xuất bản Bộ sưu tập tạp chí điện tử: Với Greenstone ta có thể tạo ra các sưu tập về tạp chí điện tử theo từng số xuất bản mà không phá vỡ cấu trúc mục lục nguyên gốc của tạp chí điện tử đó, làm cho người sử dụng không thấy có sự khác biệt của tạp chí khi đưa vào quản lý bởi phần mền Greenstone và tạp chí điện tử nguyên gốc xuất bản trên mạng của nhà xuất bản như: TidBITS, Journal of Artificial Intelligence Research (The New Zealand Digital Library). Ngoài ra cũng có thể sưu tập hoàn toàn là danh mục tạp chí (chỉ biên mục quản lý nguồn mà không quản lý dữ liệu toàn văn của từng bài tạp chí) mà người sử dụng khi kết nối nội dung sẽ kết nối trực tiếp đến tạp chí gốc của nhà xuất bản: IISc Publication (Indian Institute of Science, India) Hình 4.3: Danh mục tạp chí của IISc Publications (Indian Institute of Science, India) NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ 118 Bộ sưu tập báo: The Silent Worker (Washington Research Library Consortium (WRLC), USA. Bộ sưu tập này sử dụng dạng tài liệu toàn văn File format PDF của nguyên dạng hình ảnh scan, báo không dùng File chuyển đổi sang HTML (tham khảo thêm tại địa chỉ: Hình 15: Bộ sưu tập Argus (Illinois Wesleyan University. USA ) Bộ sưu tập eBooks: Books From the Past (Culturenet Cymru and the Welsh Books Council) sưu tập sách toàn văn xuất bản từ đầu thế kỷ XIX đến giữa thế kỷ XX, của hai ngôn ngữ English và Welsh. Người sử dụng có thể tra cứu nhan đề, tác giả và thời gian xuất bản (Tham khảo thêm tại địa chỉ Hình 4.4: Ví dụ minh họa bộ sưu tập Books From the Past 3.2. Các bộ sưu tập theo dạng lưu trữ tài liệu Tài liệu sưu tập là âm thanh, video: - Sưu tập Music Library (The New Zealand Digital Library ) tập hợp gần 10.000 giai điệu nhạc, người sử dụng có thể nghe Download Ebooks dạng Duyệt sách theo mục lục CHƯƠNG 4. BỘ SƯU TẬP VÀ BIÊN MỤC TÀI LIỆU SỐ 119 nhạc trực tiếp từ sưu tập này với sự hỗ trợ của các phần mềm Media: Media Player, Windows MPEC kích hoạt tự động từ máy tính hay có thể sao lưu vào máy tính của mình. - Sưu tập Music Video (The New Zealand Digital Library) là sưu tập Video ca nhạc từ MTV mà người sử dụng tìm kiếm theo tên bài, thể loại nhạc hay tên các ca sĩ trình diễn: Eric Clapton, George Michael và Elton John Hình 4.5: Ví dụ minh họa bộ sưu tập Music Video (Tham khảo thêm tại địa chỉ Tài liệu sưu tập là hình ảnh Việc sử dụng Greenstone để xây dựng các sưu tập hình ảnh của các thư viện được giới thiệu rất nhiều trên Internet rất đa dạng cách thể hiện cấu trúc và hiển thị, có hai sưu tập được đánh giá là sưu tập lớn và chất lượng. Trong hai sưu tập này thể hiện sự kết hợp chặt chẽ của biên mục truyền thống với dữ liệu Metadata và hiển thị biểu ghi này cùng với chế độ Thumbnail hình ảnh, và khi người sử dụng Click chọn vào đó mới hiển thị chế độ View hình ảnh ở cỡ lớn. - The Virginia Civil War Archive của Washington Research Library Consortium (WRLC), USA. Là sưu tập có hơn 400 hình minh họa từ tạp chí Harper's Weekly từ 1861-1865. - American University History Photograph and Print Collection của Washington Research Library Consortium (WRLC), USA. Sưu tập này bao gồm các ảnh chụp về lịch sử, sinh hoạt, những sự kiện liên quan trong lịch sử nước Mỹ. Từ tòa nhà đầu tiên của trường vào năm 1896 đến 1960. NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ 120 Hình 4.6: Ví dụ minh họa bộ sưu tập The Virginia Civil War Archive (Tham khảo thêm tại địa chỉ Hình 4.7: Ví dụ minh họa bộ sưu tập American University History Photograph and Print Collection ( - Sưu tập Chopin Early Editions: Là sưu tập hơn 400 tác phẩm âm nhạc của Frédéríc Chopin của The University of Chicago Library, USA. Sưu tập giữ nguyên gốc hình ảnh scan từ các bản nhạc để bảo đảm tính nguyên gốc, chúng ta có thể sao lưu và in ấn để sử dụng. Sưu tập sử dụng dạng hiển thị tài liệu nguyên bản của những trang nhạc được in hay chép tay theo từng trang, từng chương theo cấu trúc mục lục của tài liệu gốc. Các tác phẩm của Frédéríc Chopin thường được xuất bản trùng lặp nhau trên thế giới với các kiểu bản in khác nhau, Greenstone cho phép người sử dụng có thể kết nối đến các tài liệu giống nhau để so sánh và đối chiếu. Trong Chopin Early Editions có thể tìm kiếm hay liệt kê theo nhan đề, thể loại và số bản nhạc. Xem theo Nhân vật Xem theo Tiêu đề Xem theo Địa điểm Xem theo Chủ đề CHƯƠNG 4. BỘ SƯU TẬP VÀ BIÊN MỤC TÀI LIỆU SỐ 121 Hình 4.8: Ví dụ minh họa bộ sưu tập Chopin Early Editions (Tham khảo thêm tại địa chỉ Tài liệu sưu tập là văn bản, hình ảnh, âm thanh ICADL 2001 Sample Collection: Là sưu tập các báo cáo khoa học và các tài liệu liên quan của Hội nghị Thư viện số châu Á lần thứ 4 từ ngày 10-12/12/2001 tại Bangalore, Ấn Độ. Tập hợp các tài liệu theo nhiều dạng toàn văn HTML, PDF, Doc và các Slide báo cáo bằng Microsoft PowerPoint kèm theo thuyết minh MP3. Với sưu tập này người sử dụng có thể tìm hiểu và tiếp cận hội nghị một chi tiết đến từng báo cáo. Trong sưu tập tìm kiếm theo nhan đề, chủ đề và tác giả báo cáo. Đây là một sưu tập rất đa dạng về loại hình tài liệu toàn văn với sự kết hợp tài liệu đa phương tiện (Tham khảo thêm tại địa chỉ: Hình 4.9: Ví dụ minh họa bộ sưu tập ICADL 2001 Trên đây, là một số mẫu mô hình các sưu tập được tổ chức bởi các thư viện trên thế giới cho chúng ta cái nhìn tổng quát về việc tổ NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ 122 chức bộ sưu tập thông tin, với nhiều cách thể hiện, thay đổi giao diện bên ngoài và giao diện tìm kiếm cũng như tổ chức dữ liệu khác nhau. Nhưng đều cùng một mục đích chính là làm sao đưa được sưu tập đến người sử dụng với các khả năng tìm kiếm đa dạng và tiếp cận tài liệu toàn văn một cách hiệu quả nhất. 4. SỬ DỤNG CÁC BỘ SƯU TẬP Dịch vụ tham khảo: Dịch vụ tham khảo cung cấp thông tin cho người sử dụng từ mọi nguồn có trong và ngoài thư viện. Sử dụng phần mềm Greenstone để tổ chức thông tin thành những bộ sưu tập chuyên ngành theo những đề tài được yêu cầu. Những bộ sưu tập này được tái đóng gói lên CD-ROM để cung cấp cho người sử dụng. Người sử dụng có thể truy tìm và lướt tìm thông tin theo từ khóa, tác giả, nhan đề, đề mục và những điểm truy cập khác trên chính CD-ROM của mình. Công tác địa chí: Những tài liệu địa chí của địa phương bao gồm đủ mọi hình thức từ những di chỉ, mẫu vật đến công trình kiến trúc, tài liệu văn bản cỗ, vv đều có thể số hóa; rồi biên mục trên từng tài liệu và tổ chức trong một hay nhiều bộ sưu tập theo đề tài. Thật dễ dàng trong việc lưu trữ phục vụ công tác nghiên cứu cũng như quảng bá rộng rãi phục vụ công tác du lịch. Kho tài nguyên học tập trong trường đại học: Từng giảng viên hay nhà nghiên cứu, sưu tầm tài liệu theo chuyên ngành của mình, tổ chức thành bộ sưu tập rồi đóng góp cho thư viện một bản Lưu trữ và quản lý công văn: Trong việc lưu trữ và quản lý công văn, mỗi văn bản được xem như một tài liệu. Sử dụng chuẩn Dublin Core linh họat để biên mục từng tài liệu và quản lý theo cấp, đề tài, ngày, cơ quan chủ quản, người ban hành và ký công văn, người sử dụng dễ dàng truy tìm và lướt tìm Bộ sưu tập công văn cho dù lớn bao nhiêu. 5. CÔNG CỤ XÂY DỰNG BỘ SƯU TẬP Hiện nay trên thế giới, xu thế phát triển thư viện số đã trở thành một phần không thể thiếu trong toàn cảnh hoạt động thông tin thư CHƯƠNG 4. BỘ SƯU TẬP VÀ BIÊN MỤC TÀI LIỆU SỐ 123 viện. Ở Việt Nam, các công ty phần mềm cũng đã bắt đầu xây dựng, chuyển giao các sản phẩm hỗ trợ cho quá trình tạo lập bộ sưu tập số để xây dựng kho tài nguyên số hóa của các thư viện: Greenstone, Dspace, Eprints, Digitools, Content Pro, Kipos, Libol 6.0... Nổi lên trong phân khúc phần mềm mã nguồn mở là phần mềm mã nguồn mở Greenstone và phần mềm mã nguồn mở Dspace đang được ứng dụng rất rộng rãi và bước đầu đã thành công tại một số thư viện như: Thư viện Đại học Khoa học Tự nhiên Thành phố Hồ Chí Minh, Thư viện Hải Phú, Thư viện Đại học Quốc gia Hà Nội, Thư viện Đại học Đà Lạt... Greenstone là một bộ phần mềm dùng để xây dựng và phân phối các bộ sưu tập thư viện số, một giải pháp mới để tổ chức và xuất bản thông tin trên Internet và CD-ROM, cung cấp phương tiện dễ dàng cho người sử dụng truy tìm toàn văn và lướt tìm dựa vào metadata. Greenstone là sản phẩm của dự án New Zealand Digital Library của Đại học Waikato ( bin/library), được phát triển và phân phối với sự tham gia của UNESCO và Human Info NGO. Đây là phần mềm nguồn mở được cung cấp theo thỏa thuận của GNU General Public License. Greenstone hiện đang được sử dụng rộng rãi trên khắp thế giới, đặc biệt trong các cơ quan của UNESCO và thư viện trong các trường đại học. Đặc trưng của Greenstone - Truy cập qua trình duyệt Web, cả ở chế độ cục bộ (local) và từ xa (remote). - Chạy được trên nhiều hệ điều hành: Windows, Unix, Macintosh. - Tìm kiếm toàn văn bản và tìm kiếm theo từng trường riêng biệt. - Khả năng trình duyệt linh động, đa dạng. - Cấu trúc duyệt tài liệu được xây dựng hoàn toàn tự động. - Tận dụng các metadata sẵn có trong tài liệu, giúp người tạo lập bộ sưu tập không phải làm bằng tay. NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ 124 - Khả năng linh động, dễ mở rộng hệ thống nhờ các thành phần như plugin, classifier. - Hỗ trợ xử lý tài liệu với nhiều loại ngôn ngữ. - Cung cấp ... ường hợp trên thì ta phải cân nhắc thử việc số hoá của chúng ta có phải là một việc NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ 140 làm có lợi ích chung mà không xâm phạm quyền lợi của người khác. Đây là một điều khó về mặt pháp lý. Cuối cùng nếu chúng ta không chắc chắn với điều cân nhắc trên thì ta phải tiến hành xin phép để được cấp phép thực hiện số hoá. Tóm lại để tiến hành xây dựng thư viện số, ta phải lưu ý đến vấn đề bản quyền. Những người thực hiện phải cam kết hiểu biết đầy đủ về bản quyền và nhận thức sâu sắc rằng giấy phép là rất cần thiết để chuyển đổi tài liệu số hóa không thuộc trong miền công cộng. CHƯƠNG 6. XÂY DỰNG KẾ HOẠCH VÀ CHÍNH SÁCH PHÁT TRIỂN 141 Chương 6 XÂY DỰNG KẾ HOẠCH VÀ CHÍNH SÁCH PHÁT TRIỂN TVĐT 1. XÁC ĐỊNH CHÍNH SÁCH PHÁT TRIỂN TVĐT Phát triển từ thư viện truyền thống thành thư viện điện tử (TVĐT) đang là xu hướng tất yếu ở tất cả các nước. Để xây dựng được một TVĐT theo đúng nghĩa, cần có một số quan điểm thống nhất có cách tiếp cận đúng và lựa chọn những bước đi thích hợp. Để xây dựng TVĐT, chúng ta cần quan tâm nhiều vấn đề mà nổi bật là bốn khía cạnh chủ yếu: - Cấu trúc của TVĐT; - Hạ tầng cơ sở kỹ thuật; - Kho tư liệu số hóa; - Các vấn đề bảo quản, khai thác và bản quyền. 1.1. Cấu trúc của TVĐT Các TVĐT đều được bố trí trên “Giao diện Web”, trên đó, ngoài những vùng chung như: Giới thiệu về cơ quan, về hệ thống, về thư viện; hướng dẫn sử dụng và các công cụ trợ giúp thì phần chủ yếu là nội dung, tức “Tài nguyên thông tin”. - Phần thứ nhất của “Tài nguyên thông tin” thông thường là danh mục chủ đề. Phần này được cấu trúc theo trình tự từ chung đến riêng, từ tổng quát đến chi tiết, từ ngoài vào trong theo thứ bậc. Cách tổ chức như vậy nhằm tạo thuận tiện cho người dùng trong khai thác thông tin. Thông thường trong NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ 142 TVĐT các xuất bản phẩm điện tử (tạp chí, bản tin, kỷ yếu ...) được bố trí sắp xếp theo kiểu này và để tìm kiếm tài liệu theo chủ đề ta có thể vào mục tương ứng tuần tự từ ngoài vào trong. Nếu muốn tìm/truy cập nhanh tới tài liệu cần phải có sự hỗ trợ của công cụ tìm kiếm thông qua các lệnh tìm cụ thể ... - Phần thứ hai là các tổ hợp CSDL, biểu hiện danh mục các CSDL, thường được sắp xếp theo chủ đề hoặc theo vần chữ cái. Người dùng có thể tiếp cận tới các CSDL này để khai thác thông tin theo các cấp độ khác nhau: từ thư mục tới toàn văn; khai thác riêng rẽ từng CSDL hay khai thác theo nhóm CSDL... Mức độ khai thác đến đâu tùy thuộc vào khả năng của hệ thống và đặc biệt là sự cho phép của cơ quan chủ quản, các lệ phí tương ứng. - Phần thứ ba là phần liên kết tới các nguồn tài nguyên thông tin bên ngoài. Đây là thế mạnh của TVĐT. Tuy nhiên, mức độ và khả năng liên kết đến đâu phụ thuộc vào sự hợp tác với các cơ quan khác và việc khai thác các tầng thông tin số hóa đó cũng có những khác biệt: có vùng thông tin khai thác tự do, miễn phí; nhưng cũng có những vùng phải có mật khẩu, phải trả tiền... Như vậy, TVĐT không chỉ có một hệ thống mà có thể gồm nhiều hệ khác nhau. Tuy nhiên, các tài nguyên thông tin, các CSDL đó liên kết được với nhau trong một chế độ phục vụ thống nhất. Tức là khi được yêu cầu, chúng xuất hiện đối với người dùng như thể chúng cùng trong một hệ thống. 1.2. Hạ tầng cơ sở kỹ thuật Một TVĐT phải có hạ tầng cơ sở đủ mạnh đó là: - Mạng Intranet có tốc độ kết nối nhanh với Internet. - Hệ thống máy chủ lớn thực hiện việc quản trị các dịch vụ khác nhau: Máy chủ Web, máy chủ FTP, Mail, các máy chủ lưu trữ dữ liệu, máy chủ Firewall, máy chủ cho các ứng dụng khác... - Hệ thống máy trạm để cập nhật, khai thác thông tin. CHƯƠNG 6. XÂY DỰNG KẾ HOẠCH VÀ CHÍNH SÁCH PHÁT TRIỂN 143 - Các thiết bị công nghệ chuyên dụng cho TVĐT: mã vạch, thẻ từ, RFID, máy quét, máy sao dữ liệu ... - Phần mềm phục vụ cho việc xây dựng và phát triển TVĐT: Phần mềm TVĐT, phần mềm hệ thống, hệ điều hành, hệ quản trị CSDL, phần mềm xuất bản điện tử, xuất bản CD-ROM ... 1.3. Kho tư liệu số hóa (Tham khảo mục II chương VI) 1.4. Các vấn đề bảo quản, khai thác và bản quyền (Tham khảo mục II chương V) 2. XÂY DỰNG KẾ HOẠCH PHÁT TRIỂN NGUỒN TIN ĐIỆN TỬ Một phần quan trọng trong TVĐT chính là kho tư liệu số hóa của bản thân cơ quan thông tin/thư viện chủ quản. Có 3 cách để tạo lập Kho này, đó là: - Tự tiến hành số hóa nguồn tư liệu trên giấy của thư viện. Tức là chuyển tài liệu hiện có sang dạng số bằng phương pháp quét hay nhập lại thông tin từ bàn phím ... Đây là hướng phải đầu tư lớn, đầu tư liên tục và tốn kém thời gian, tiền của, công sức. - Bổ sung/tích hợp nguồn tin điện tử thông qua việc mua, trao đổi tài liệu điện tử đang được xuất bản (bản tin, tạp chí điện tử, các chế bản điện tử trước khi in ra trên giấy). Chúng ta đều biết: hầu hết các ấn phẩm hiện nay đều vừa xuất bản trên giấy vừa tồn tại dưới dạng điện tử và nếu tận dụng được nguồn này, ta sẽ tiết kiệm được nhiều công sức, thời gian. - Xây dựng các liên kết (tạo khả năng truy cập) đến các nguồn tài liệu trên Internet, nhất là nguồn của các cơ quan có cùng diện chuyên đề bao quát. Tạo lập và phát triển Kho tư liệu số của riêng mỗi cơ quan thông tin/thư viện là vấn đề lớn nhất trong xây dựng TVĐT. Công việc này đòi hỏi phải đầu tư lớn và liên tục. Để làm tốt công việc này, các cơ quan xây dựng TVĐT cần có cách tiếp cận hợp lý, khả thi và kinh tế. Cụ thể là: NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ 144 - Nhất thiết phải lập kế hoạch sát sao và ưu tiên đầu tư cho việc thu thập, xử lý và số hóa nguồn tin cơ bản, nguồn tin tiềm năng của riêng mình. Coi đây là nhiệm vụ trọng tâm, thậm chí phải triển khai mạnh trước khi bắt tay vào xây dựng TVĐT. - Nếu không có sự đi trước này, khi ta xây dựng xong hạ tầng mạng và có các phần mềm hệ thống, phần mềm thư viện điện tử đầy đủ nhưng đến lúc đó cơ quan vẫn không có hoặc có rất ít tài liệu số hóa của bản thân chắc chắn TVĐT đó không thể phát huy được hiệu quả; và như vậy không tương xứng với kinh phí đầu tư nhiều tỷ đồng để xây dựng TVĐT. - Trong việc lựa chọn tài liệu để số hóa, ta phải ưu tiên các tài liệu đặc thù của thư viện, các tài liệu duy nhất và có giá trị lâu dài để trao đổi, ví dụ: các tài liệu quý hiếm, các sưu tập có giá trị (không ở đâu có) ...; ưu tiên số hóa trước hết đối với tài liệu chưa ở đâu số hóa, tài liệu tiếng hiếm, tiếng Việt ... Song song với việc số hóa là việc xây dựng các siêu dữ liệu đối với từng tài liệu và cập nhật tài liệu đã được số hóa này vào CSDL tương ứng để phục vụ kịp thời cũng như làm cơ sở cho việc xây dựng TVĐT sau này. - Ngoài ra, ta cũng cần quan tâm đến chất lượng của việc số hóa tài liệu cũng như cần sao lưu đầy đủ, kịp thời các tài liệu số hóa để tránh rủi ro cũng như tránh phải làm đi làm lại (lãng phí công sức, tiền của). Điều này phụ thuộc nhiều vào công tác tổ chức, phụ thuộc vào cán bộ thực hiện cũng như thiết bị và quy trình số hóa. - Phải phối hợp, tận dụng sản phẩm số hóa của các cơ quan thông tin/thư viện khác, nhất là của những cơ quan có cùng diện chuyên đề bao quát. Trên cơ sở đó mới có thể tăng nhanh “nguồn tin” của mình, tiết kiệm được thời gian, công sức và tiền của. Các thư viện cần có chiến lược đầu tư và triển khai kế hoạch tổng thể trong việc số hóa đối với các nguồn tin quan trọng, có ý nghĩa lâu dài. Các thư viện cần: CHƯƠNG 6. XÂY DỰNG KẾ HOẠCH VÀ CHÍNH SÁCH PHÁT TRIỂN 145 Xác lập chính sách ưu tiên số hóa 1. Về dạng tài liệu - Các đề tài nghiên cứu khoa học. - Luận văn thạc sỹ, luận án tiến sỹ. - Tài liệu hội nghị, hội thảo khoa học. - Các giáo trình, bài giảng. - Sách, tài liệu tham khảo quý hiếm. 2. Về ngôn ngữ - Tài liệu Hán Nôm. - Tài liệu tiếng Việt, hạn chế số hóa tài liệu tiếng Anh. 3. Về lĩnh vực - Ưu tiên số hóa tài liệu phục vụ các ngành, chuyên ngành đào tạo tín chỉ, đào tạo đẳng cấp quốc tế, tài liệu KHCN những ngành mũi nhọn. Xác lập và hình thành một tổ chức số hóa tài liệu - Trong mạng lưới các cơ quan thông tin, thư viện cần có sự phân công, phối hợp giữa các cơ quan trong việc số hóa tài liệu, cơ quan nào có kho tư liệu chuyên môn hóa với số lượng tài liệu nhiều nhất về lĩnh vực nào thì sẽ đảm nhận số hóa nguồn tư liệu về lĩnh vực đó, các cơ quan khác hỗ trợ trong việc số hóa. - Bản thân trong các thư viện nên tổ chức một bộ phận chuyên trách cho việc thu thập, số hóa, xử lý các nguồn tin điện tử. Nghiên cứu, lựa chọn và xác lập những chuẩn, quy định chung trong việc số hóa tài liệu - Các cơ quan thông tin thư viện tiến hành số hóa cần có những chuẩn cũng như các quy định thống nhất đối với việc số hóa tài liệu. Những chuẩn này được xác định trên cơ sở nghiên cứu, áp dụng chuẩn của nước ngoài vào điều kiện cụ thể của Việt Nam. Mỗi cơ quan tham gia mạng lưới số hóa đều phải NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ 146 tuân thủ nghiêm ngặt những chuẩn này sao cho các tài liệu số hóa luôn đảm bảo về mặt chất lượng cũng như về tiến độ thời gian; đồng thời chúng được tổ chức trong các CSDL có cấu trúc tương hợp hoặc dễ dàng trong chuyển đổi. - Có như vậy các tài liệu số hóa đó mới có thể phục vụ rộng rãi trong toàn mạng lưới và mang lại hiệu quả cao. Tổ chức số hóa tài liệu ở quy mô công nghiệp - Hoạt động số hóa ở quy mô lớn được gọi là “Công nghiệp nội dung” (CNND). Người ta coi CNND bao gồm: thu thập thông tin; phân tích nội dung để phân loại, lưu trữ; bao gói thông tin thành các CSDL (trên CD, DVD, thiết bị lưu trữ ...), nhân sao và cung cấp/bán các CSDL đó. - Nguyên vật liệu đầu vào của ngành CNND là thông tin và đầu ra cũng là thông tin. Nhưng thông tin đầu ra là CSDL, là thông tin có cấu trúc, có nội dung cụ thể và được bán/cung cấp cho những đối tượng cụ thể nhằm phục vụ cho một/một số hoạt động nhất định. Để xây dựng được một nền CNND cần phải: - Có một hành lang pháp lý đủ mạnh. - Có sự phối hợp chặt chẽ về mặt tổ chức, liên kết, phân công phân mảng giữa các cơ quan có hoạt động số hóa tài liệu. - Có lực lượng cán bộ chuyên trách thu thập, số hóa, bao gói thông tin. - Trang bị các thiết bị hiện đại, ví dụ các máy quét chuyên dụng (nhanh, chất lượng cao, quét được các khổ lớn, màu sắc đẹp ...), các máy chủ lưu trữ và sao lưu chuyên dụng với dung lượng lớn; các thiết bị sao chuyên dụng. 3. XÂY DỰNG KẾ HOẠCH TÀI CHÍNH Việc xây dựng và phát triển TVĐT là một việc làm lâu dài và tốn kém, cần có sự tập trung đầu tư, sự quyết tâm của các cấp lãnh đạo và CHƯƠNG 6. XÂY DỰNG KẾ HOẠCH VÀ CHÍNH SÁCH PHÁT TRIỂN 147 có một kế hoạch triển khai cụ thể, đặc biệt là một kế hoạch tài chính đảm bảo. TVĐT không hoàn toàn tách rời thư viện truyền thống, vì vậy việc xây dựng TVĐT bao gồm các bước sau: - Xây dựng hạ tầng cơ sở đủ mạnh bao gồm: hạ tầng cơ sở vật chất, hạ tầng kỹ thuật (các trang thiết bị kỹ thuật, CNTT và phần mềm). - Xây dựng kho tài nguyên thông tin (chủ yếu là tư liệu số hóa). - Xây dựng và phát triển đội ngũ nhân sự để triển khai, vận hành hệ thống. Tùy theo quy mô của từng thư viện và các nhu cầu của từng giai đoạn cụ thể để xây dựng các kế hoạch tài chính cho phù hợp. TÀI LIỆU THAM KHẢO 149 TÀI LIỆU THAM KHẢO 1. Barker, Joe. 2006. Finding Information on the Internet: A Tutorial. University of California at Berkeley. Retrieved August 18, 2006, from ( fo.html) 2. Barnes, S. J . Becoming a digital library. New York, Marcel Dekker, 2004. 3. Basch, R. Books online: Visions, Plans and Perspective for Electronic Texts. Online, Jully 1995 4. Chowdhury, G. G., Chowdhury, S. Introduction to Digital Libraries. London: Facet, 2003 5. Cohn, John M., Ann L.Kelsey, Planning for automation, 2000 6. Cohn, John M., Ann L.Kelsey, Managing the library automation project, 2001 7. Deakin University Library. 2006. Searching the Internet. Retrieved October 3, 2006, from 8. Deanna B.Marcum. Development of Digital Libraries, Greenwood press, 2001 9. Digital Libraries: Design, Development, and Impact/Yin-Leng Theng, Schubert Foo, Dion Goh and Jin-Cheon Na; Information Science Reference, 2009 10. Dobreva, M., et al. User studies for digital library development. London, Facet, 2012 11. 12. NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ 150 13. 14. Kresh, D. (2007). The whole digital library handbook. Chicago, American Library Association. 15. Lesk, M. Understanding Digital Libraries (Second ed.). San Francisco, CA: Morgan Kaufman Publishers, 2004. 16. Marcum, D. B., George, G. Digital library development : the view from Kanazawa. Englewood, Colo., Libraries Unlimited ; Oxford : Harcourt Education [distributor], 2006 17. Michael Lesk. Understanding Digital Libraries, Second Edition (The Morgan Kaufmann Series in Multimedia Information and Systems), Elsevier, 2005 18. Nguyễn Huy Chương. Học liệu mở, truy cập mở: Giải pháp phát triển nguồn học liệu số cho các thư viện điện tử. Kỷ yếu Hội nghị khoa học Phát triển nguồn tài nguyên điện tử trong các thư viện đại học. H., 2010 19. Nguyễn Huy Chương. Tập bài giảng thư viện điện tử. H., Đại học KHXH&NV, 2009 20. Nguyễn Huy Chương. Xây dựng và phát triển thư viện điện tử trong hệ thống thư viện đại học Việt Nam. Kỷ yếu Hội thảo khoa học Phát triển Thư viện điện tử tại Việt Nam, H., 2011 21. Nguyễn Huy Chương, Nguyễn Tiến Hùng. Dspace – Giải pháp tạo lập, lưu giữ và phổ biến tài nguyên điện tử cho các thư viện ở Việt Nam. Kỷ yếu Hội nghị khoa học Phát triển nguồn tài nguyên điện tử trong các thư viện đại học. H., 2010 22. Nguyễn Minh Hiệp, Sử dụng phần mềm nguồn mở thư viện số Greenstone để xây dựng kho tài nguyên học tập nhằm nâng cao chất lượng đào tạo nguồn nhân lực. Tp. HCM, Đại học KHTN, 2006. 23. Nguyễn Thị Bắc, Bài giảng “Lập kế hoạch tự động hóa trong thư viện” . Tp. HCM, 2008 24. Serge Linckels and Christoph Meinel, "E-Librarian Service: User- Friendly Semantic Search in Digital Libraries", 2011 TÀI LIỆU THAM KHẢO 151 25. Sullivan, Danny (2005). Kids Search Engines. Search Engine Watch. Retrieved January 7, 2008, from 26. Hanson, T., Day. Managing the electronic library. Lond. : Browker Sauer, 1998 27. Understanding Digital Libraries, Second Edition/ Michael Lesk; Morgan Kaufmann, 2005 28. Verheul, I., et al. Digital library futures: user perspectives and institutional strategies. The Hague, Walter De Gruyter, 2010 29. Vũ Thị Nha, Tìm kiếm thông tin trên Internet, Trung tâm Thông tin Phát triển Việt Nam 30. Vũ Văn Sơn, Giáo trình biên mục mô tả, Hà Nội: Nxb Đại học Quốc gia Hà Nội, 2002. - 283 tr 31. Witten, I. H., & Bainbridge, D. How to Build a Digital Library. San Francisco, CA: Morgan Kaufman Publishers, 2003. 32. Yin-Leng Theng, Schubert Foo, "Design and Usability of Digital Libraries: Case Studies in the Asia Pacific", 2005.
File đính kèm:
- thu_vien_chuong_4_bo_suu_tap_va_bien_muc_tai_lieu_so.pdf