30/5/12

Vấn đề bộ gõ và font tiếng Thái

VỀ BÀN PHÍM CHỮ THÁI

Tình hình phát triển bộ gõ cho chữ Thái Việt Nam:


 Điểm qua tình hình:
- Hiện tại các bộ gõ “Standar Thai Son La” và “TaiHeritage” có thể đánh mà không cần chương trình hỗ trợ bên ngoài, vì khi tạo font đã ghi đè tên ký tự bằng tên các chữ cái trên bàn phím tiếng Anh bình thường (khu vực mã ASCII thấp), đây là một hình thức ghi đè lên mã ASCII. Giải pháp này khá hiệu quả để đánh ngay được chữ Thái, nó cũng có căn cứ nhất định, đó là số kí tự chữ Thái nhỏ hơn số các phím kí tự “khả kiến” trên bàn phím tiếng Anh, nên xếp gọn trong bàn phím tiếng Anh. Tuy nhiên đây không phải giải pháp chính quy, vì gây tranh chấp mã giữa các bộ chữ khác nhau và mới chỉ xét ở bình diện bộ mã 8 bit. Cách xử lý đó sẽ gây trở ngại khi mở rộng giao lưu văn hóa trên mạng, gây khó khăn cho các tác vụ trao đổi thông tin, xử lý văn tự, xây dựng từ điển tiếng dân tộc .v.v.
- Bộ gõ của Dự án Số hóa chữ Thái (Viện CNTT) giới thiệu tại HN chữ Thái 2005 khá quy củ vì sử dụng hệ thống mã hóa unicode 2 byte, dùng kỹ thuật Keyboard Hook để quản lý bàn phím thực như UNIKEY, VIETKEY, nhưng do vấn đề mới xét trên khía cạnh lí thuyết mà chưa tính tới thực tế người sử dụng  nên còn chưa được ứng dụng thực tiễn…
- Bộ gõ của viện AIST Nhật (www.m17.n.org) ứng dụng mã nguồn mở trên nền Linux để xử lý đa ngữ, có tính bao quát và phát triển có bài bản, nhưng người dùng cuối ở VN quen xử dụng nền Windows nên bộ gõ này trước mắt có thể  khó phổ biến .  
 Các vấn đề đặt ra cho bàn phím:
Có hai điểm đặc trưng của Chữ Thái mà bộ gõ sẽ phải xử lý:
Đặc điểm (1): Bộ chữ Thái thống nhất mới đã sử dụng các dấu ký tự nguyên âm cổ viết trên và dưới phụ âm. Đó là các ký tự không dãn cách (tiếng Anh: non-spacing), khi hiển thị sẽ chồng lên chữ đứng trước hay sau. Trong font TTF đó là các ký tự được vẽ dịch về bên trái (hay bên phải) để khi hiển thị sẽ nằm trên hay dưới chữ đứng trước (hay đứng sau). Các ký tự này rất quan trọng vì là nguyên âm chính của từ, không phải là các dấu phụ như trong tiếng Việt (trong tiếng Việt nhiều khi viết không dấu nhưng người đọc vẫn dễ dàng đoán được từ).
Bộ chữ Thái thống nhất mới đã đưa vào 7 ký tự không dãn cách giống với bộ chữ Sơn La và Tai Dam:











Xuất hiện các vấn đề là khi người ta gõ 2-3 hay nhiều phím non-spacing, các chữ sẽ trùng nhau trên màn hình, đan xen lộn xộn không nhìn được gì, hoặc là người dùng không thấy gì mới nhưng trong lưu trữ đã có một loạt ký tự non-spacing ghi vào rồi. Điều này các bộ gõ của Thái Sơn La và SIL Tai Dam đều mắc phải.
Đặc điểm (2): Chữ Thái VN và các chữ cùng họ như Thái Lan, Lào... đều có một điểm đặc thù riêng là có nhiều nguyên âm viết bên trái, trước phụ âm đầu, tức là ngược với thứ tự phát âm. (Khi lưu trong các thiết bị nhớ thì có thể thuận mà cũng có thể ngược thứ tự phát âm, vấn đề này khá rắc rối đã đề cập trong bài của nhóm SIL Tai Dam. Các đề xuất xử lý các kí tự này có thể tham khảo bài của  James L. Brase, SIL International, Phụ lục 2: “Mã hoá nguyên âm - thứ tự trực quan hay thứ tự phát âm”) 
 Khó khăn nảy sinh là do người mới học chữ Thái VN hiện nay, thường đã quen với cách viết thuận thứ tự phát âm của tiếng Việt, tiếng Anh và các ngôn ngữ La-tinh.

Giới thiệu bố trí bàn phím chữ Thái Thống nhất:





















VỀ FONT CHỮ THÁI VIỆT NAM

Giới thiệu tình hình làm font và một số bộ font chữ Thái Việt Nam

Ở nước ngoài:- Nhóm SIL Tai Dam ở Mỹ là nhóm bắt tay làm font chữ Thái từ khá sớm, theo báo cáo của James L. Brase (SIL International) thì khoảng các năm 1980 đã có font bitmap chữ Thái, khoảng đầu những năm 1990 đã có font true type (TTF) cho cả hai hệ thống Apple Macintos và PC (Windows). Font cho Apple Macintos hoàn thiện hơn nhưng hệ thống này không được hỗ trợ phát triển tốt như trên PC Windows, nên hiện nay ở Mỹ sử dụng phổ biến font TTF trên Windows, đó là chính là bộ font “TaiHeritage” (Di sản Thái). Bộ font này được thiết kế công phu, tự dạng theo khá sát các văn bản Thái cổ, cụ thể là sát với dạng viết trong cuốn “Xổ phi hươn” của dòng qúy tộc Lò Cầm ở Mai Châu, Sơn La (trong cuốn “Danh sách tổ tiên họ Lò Cầm, Mai Sơn, Sơn La” của Cầm Trọng, NXB Thế giới 2003).
- Đặc điểm của font “TaiHeritage” là dùng kỹ thuật font tổ hợp để có thể đặt các ký tự nguyên âm trên hay dưới phụ âm đúng theo dạng cổ, các ký tự này được vẽ lùi về bên trái để hiển thị trên hay dưới phụ âm, chúng không có khoảng cách với các ký tự đứng trước, nên gọi là các ký tự không dãn cách (nonspace).
- Do các ký tự chữ Thái có bề rộng thay đổi khác nhau rất lớn nên để có thể đặt dấu nguyên âm trên dưới phụ âm một cách cân đối, font “TaiHeritage” đã cho một dấu nguyên âm Thái ứng với vài ký tự nonspace, phân biệt theo vị trí tương đối với phụ âm: thấp, vừa , cao, rất cao (theo chiều đứng) và vừa, xa, rất ra (theo chiều ngang)…
- Bộ font này đặt tên các ký tự trùng với các chữ cái tiếng Anh trong khu vực mã ASCII nên có thể đánh chữ trực tiếp trên bàn phím tiếng Anh (sẽ nói kỹ hơn trong phần Bàn phím).

Ở trong nước:
            - Dự án Số hóa chữ Thái của viện CNTT và đã phát triển một bộ font TTF chữ Thái, tiếp thu các kết quả của bộ chữ Thái Thống nhất, nhưng mạnh dạn đưa vào cả các ký tự dấu nguyên âm cổ không dãn cách. Bộ font này bao quát tốt nhiều biến thể ký tự của các nhóm dân tộc Thái ở Việt Nam, có tính quy củ và sư phạm, lại dựa trên nền bộ chữ Thái Thống nhất là bộ chữ duy nhất từng được nhà nước công nhận và dùng để dạy chữ Thái hàng chục năm trước.
            - Do hiện tại chữ Thái VN vẫn chưa được đưa vào chuẩn Unicode quốc tế nên bộ chữ Thái Thống nhất tạm sử dụng khu vực symbol trong mặt phẳng mã hóa cơ sở bắt đầu từ điểm mã F000 (61440), tổng cộng 128 ký tự, có tăng thêm nhiều kí tự cổ truyền so với bộ chữ thống nhất cũ  chỉ có 84 ký tự.
            - Gần như đồng thời, nhóm nghiên cứu chữ Thái ở Sơn La của Thạc sĩ Lò Mai Cương (trường CĐSP Sơn La) cũng có công trình làm Font và bộ gõ chữ Thái, cùng được công bố ở Hội nghị quốc tế về chữ Thái 11-2005. Bộ font Sơn La có ưu điểm là thiết kế khá mỹ thuật, lại cung cấp một số kiểu dạng font khác nhau nên có giá trị thực tiễn khi chế bản sách chữ Thái.  
- Có lẽ nhóm Sơn La đã tiếp thu các kết quả của nhóm SIL Tai Dam, nhất là thủ thuật đặt tên ký tự để gõ trên nbàn phím tiếng Anh. Nhưng các ký tự không dãn cách lại vẽ lệch sang bên phải, hiển thị trên dưới các ký tự đứng sau, ngược với font Thống nhất và SIL Tai Dam, nên thứ tự gõ và lưu trữ trên đĩa bị đảo lộn khác đi, sẽ khó khăn cho mục tiêu thống nhất chữ Thái.


10/2006


Nguồn: http://www.huesoft.com.vn/chuthaivietnam

Không có nhận xét nào:

Đăng nhận xét