Thêm bốn Chữ·cái F, J, W và Z vào bảng·chữ·cái Tiếng Việt không nhằm mục·đích phục·vụ cho lối khõ Telex trên máy điện·toán.

Thêm bốn Chữ·cái F, J, W và Z vào bảng·chữ·cái Tiếng Việt không nhằm mục·đích phục·vụ cho lối khõ Telex trên máy điện·toán.

Tác·giả: Đặng Hải Nguyên.

Viện·dẫn lý·do để bác·bỏ việc thêm W, J, F và Z vào Tiếng Việt chỉ vì những chữ·cái này được sử·dụng cho bộ khõ Telex trên máy điện·toán cần nên xem·xét lại!? Lối khõ (type, typing) Telex– a way to type out Vietnamese– ngày càng được ít người sử·dụng. Nó sẽ trở·nên lỗi·thời (obsolete) trong tương·lai gần.

Hệ·thống máy điện·toán dựa trên nền·tảng (foundation) hệ·thống chữ biểu âm La·tinh, cụ·thể là đặt căn·bản trên ASCII (American Standard Code for Information Interchange). Khởi·thuỷ, người·ta chỉ sử·dụng 128 ký·tự (character) gồm có 94 ký·tự in·được (printable character), 33 ký·tự điều·khiển (control character hoặc non-printing control character) và khoảng·trống (space). 94 ký·tự in·được (printable character) này gồm có 52 chữ·cái La·tinh (26 chữ hoa và 26 chữ thường, trong đó bao·gồm cả F, f, J, j, W, w, Z, z), 10 ghít hay ký·số (digit)— gồm·có 0, 1, 2, 3, 4, 5, 6, 7, 8 và 9— Ả·rập để ghi tất·cả các số thập·phân (decimal number) lớn nhỏ trên cỏi đời này và 32 ký·tự khác không phải là chữ·cái, chẳng hạn như (␠, !, @, “, #, $, %, ^, &, *, )… được dùng trong nhiều lãnh·vực khác nhau, chứ không riêng gì cho ngành điện·toán.

Chúng·ta chỉ sử·dụng 44 chữ·cái (vì không sữ·dụng F, f, J, j, W, w, Z, z) trong số 52 chữ·cái La·tinh tiêu·chuẩn (gồm có chữ hoa và chữ thường). Thế·nhưng, chúng·ta lại cần biểu·thị (denote) thêm các chữ·cái đặc·trưng của Tiếng Việt như Ă, ă, Â, â, Ê, ê, Ơ, ơ, Ư, ư, Đ, đ, vv., và 5 dấu thanh·điệu (tone mark) gồm huyền, hỏi, ngã, sắc và nặng. Chính vì lẽ này mà Tiếng Việt chúng·ta đã trãi·qua một thời·gian dài lộn·xộn với nhiều lối khõ khác nhau Telex, VIQR, VNI, vv., sử·dụng khoảng 14 bảng mã khác nhau như VNI, TCVN, Bk, HCM, VIQR, vv. May thay, Unicode ra đời, Tiếng Việt chúng·ta đã có được một chuẩn thống·nhất. Như·vậy, việc sử·dụng bộ khõ Telex chỉ là giải·pháp vá·víu— không có chó, bắt mèo ăn cứt— tạm·thời trong quá·khứ và sẽ trở·thành lỗi·thời trong tương·lai. Chẳng·hạn như: dùng aw thay cho chữ ă, ví·dụ “trăng” viết là “trawng”; ow thay cho ơ, ví dụ “mơ” viết là “mow”; uw thay cho ư; chữ·cái f đặt ở cuối từ thay cho dấu huyền, ví dụ từ “huyền” viết là “huyeenf”; chữ·cái j đặt ở cuối từ thay cho dấu nặng, ví dụ từ “nặng” viết là “nawngj”.

Hiện·nay, tuy vẫn còn một số·ít người đã quen dùng nên không muốn thay·đổi hoặc sử·dụng nó trong một ít trường·hợp khi bộ khõ chuẩn hoặc bàn·phím (keyboard) Tiếng Việt không·có·sẵn (unavailable). Xét về mặt lịch·sử, lối khõ Telex bắt·đầu được sử·dụng trong máy điện·tín (telegraph) trong thời·kỳ đầu 1920-1930 ngày xưa, trong máy điện·toán (computer) vào lúc giao-thời (transitional stage), để ghi Tiếng Việt là hợp·lý, vì lúc đó chúng·ta không có lựa·chọn nào·khác.

Ngày·nay, hầu·hết các hệ điều·hành như Windows, Unix, Linux, Mac OS, iOS, Android, vv., đều có·sẵn bàn·phím Tiếng Việt. Do·đó, việc sử·dụng bốn chữ·cái F, J, W và Z phối·hợp với một số chữ·cái khác để thay·thế cho các chữ·cái đặc·trưng và các dấu thanh·điệu của Tiếng Việt trong điện·toán bằng lối khõ Telex sẽ bị lỗi·thời. Việc sử·dụng bộ khõ Telex chỉ là giải·pháp vá·víu, tạm·thời và không còn phù·hợp với mức·độ phát·triễn hiện·nay của Tiếng Việt trong lãnh·vực điện·toán; xin đừng viện·dẫn lý·do này để bác·bỏ việc bổ-túc— bổ·sung cho đầy·đủ— W, J, F và Z vào bảng·chữ·cái Tiếng Việt!

Thêm bốn chữ·cái F, J, W và Z không nhằm mục·đích cải·tiến (improve), cải·cách (reform) Bảng·chữ·cái Việt·nam Tiêu·chuẩn (Vietnamese Standard Alphabet) truyền·thống gồm 29 chữ·cái (letter) đang khá ổn·định. Chúng·ta thêm bốn Chữ·cái Nới·dài (Vietnamese Extended Letter) như một sự tu·chính (amendment) nhằm đáp·ứng với những đòi·hỏi mới, nhu·cầu mới thích·ứng với việc hợp·tác và hội·nhập quốc·tế.

Nếu bảng·chữ·cái mới được nhiều người ủng·hộ và được giới hữu·trách chấp·nhận, bảng·chữ·cái mới này cần được mang tên mới nhằm khẳng·định và bảo·đảm rằng bảng·chữ·cái truyền·thống (legacy alphabet) vẫn hoàn·toàn không thay·đổi gì cả; nói cụ·thể hơn, mọi cách viết, chính·tả vẫn giữ nguyên như cũ, ví·dụ như không thay·thế “ph” bằng “f”, không thay·thế “gi” bằng “j”, không thay·thế “qu” bằng “w”, không thay·thế “d” bằng “z”, vv., và chúng·ta chỉ bổ-túc thêm bốn chữ·cái nới·dài. Chúng·ta sẽ gọi bảng·chữ·cái mới gồm 33 chữ·cái là Bảng·chữ·cái Việt·nam Nới·dài (Vietnamese Extended Alphabet), chẳng·hạn, nhằm phân·biệt với Bảng·chữ·cái Việt·nam Tiêu·chuẩn truyền·thống gồm 29 chữ·cái đang khá ổn·định và đồng·thời  cũng tránh được những sáo·trộn không·đáng·có.

 

– – · o O o · – –

Thuật·vựng (Glossary)

1. Chữ, chữ·viết hay mã (script): được dùng để chỉ tất·cả các phương·tiện cụ·thể— bao·gồm hình vẽ (drawing picture), biểu·tượng (symbol) hoặc dấu·hiệu (sign), ký·tự (character), chữ·cái (letter), từ·ngữ (word), vv.— được sử·dụng để biểu·thị (denote) hoặc đại·diện (represent) cho một âm·thanh (sound), một âm (phone), một ý (idea), hoặc một nghĩa (meaning) nào·đó gắn·liền với tiếng·nói (voice), lời·nói (speech) được con·người (human) sử·dụng để giao·tiếp.

2. Ký·tự (character):
Ký·tự: tất·cả hình vẽ (drawing picture), biểu·tượng (symbol), ký·hiệu (notation), dấu hiệu (sign), vv. nhằm giúp con·người giao·tiếp.

Hán-tự hay ký·tự Hán (Chinese character): Hệ·thống chữ·viết Trung·hoa (Chinese script system): Trong hệ·thống này, thay·vì sử·dụng một vài chục chữ·cái, người·ta sử·dụng hơn tám ngàn hình vẽ (drawing picture), biểu·tượng (symbol), dấu·hiệu (sign) phức·tạp hoặc “ký·tự” (character) để ghi tiếng·nói và ý-nghĩa (idea & meaning) của lời·nói (speech), để đại·diện cho hình·vị (morpheme) và từ·ngữ (word).

Nôm-tự hay ký·tự Nôm (Nôm character), hoặc chữ Nôm (Nôm script): Quốc-ngữ xưa (Vietnamese ancient national language), hệ·thống chữ·viết đặt·căn·bản trên ký·tự Trung·hoa (Chinese charater-based script system) để ghi tiếng (sound) Việt, phát·âm (pronounciation) Việt, âm (phone) Việt và tiếng·nói (voice) Việt. Nôm-tự đã hoàn·thành sứ·mạng lịch·sử là giữ·gìn và truyền·lại được tiếng·nói Việt, phong·tục, tập·quán, vv., của Người Việt cho các thế·hệ sau qua các tác·phẩm dân·gian, văn·chương truyền·khẩu, các tác·phẩm văn·chương Việt…
Ngày·nay, chữ Nôm (Quốc-ngữ xưa)— hệ·thống chữ·viết Việt sử·dụng chữ Hán để ghi âm Việt— đã tự-nhường·chỗ cho chữ Việt·nam (Quốc-ngữ nay)— hệ·thống chữ·viết Việt sử·dụng chữ·cái La·tinh và chữ·cái Việt để ghi âm Việt·nam. Nôm-tự đã tự·đào·thải và trở·thành di·sản văn·hoá.

3. Chữ·cái (letter): ký·tự in·được (printable character) được sử·dụng để đại·diện cho mỗi âm·vị (phoneme)— hay âm·thanh gốc, hay âm·thanh cái. Ví·dụ như từ “tôi” do ba chữ·cái hợp·lại, trong đó mỗi chữ·cái “t”, “ô” và “i” theo thứ·tự lần·lượt đại·diện cho các đơn·vị âm·thanh nhỏ·nhất /t/, /ô/ và /i/ hợp·thành tiếng /tôi/. Các ký·tự khác, chẳng·hạn như !, @, #, $, %, ^, &, *, (, ), _, +, vv., không phải là chữ·cái vì không đại·diện cho âm·vị nào·cả (any), nhưng ngược·lại, tất·cả chữ·cái đều là ký·tự.

– – · o O o · – –

* Thống·kê số·lượng các từ·ngữ của toàn bài·viết.
Tôi sử·dụng chương·trình đếm từ·ngữ trên máy điện·toán (word counting program on the computer) để đếm số·lượng từ·ngữ trong bài này. Toàn bài·viết có 3.024 ký·tự (character) nếu bao·gồm khoảng trắng, 2503 nếu không·bao·gồm khoảng trắng (white spaces are excluded), bất·kể chúng·ta viết Tiếng Việt một·cách luông·tuồng, không đầu không đuôi và rời·rạc, không phân·biệt từ·ngữ (word) và âm·tiết (syllable)— theo cách viết Hán-tự (Chinese character) của Người Trung·hoa cách đây vài ngàn năm— hoặc theo cách viết Tiếng Việt đa·âm·tiết phân·biệt tách·bạch giữa từ·ngữ và âm·tiết.

Tôi xin nói rõ thêm, thuật·ngữ “ký·tự”, theo cách hiểu hiện·nay của thế·giới, được dùng trong bài·này để chỉ tất·cả hình vẽ (drawing picture), biểu·tượng (symbol), ký·hiệu (notation), dấu hiệu (sign), vv., nhằm giúp con·người giao·tiếp. Ví·dụ như:
* Các ký·tự đặc·biệt (special character) !, @, #, $, %, ^, &, *, (, ), _, +, vv.
* Các dấu ngắt·câu (punctuation mark) ví·dụ như “.”, “;”, “…”, “[“, “]”, vv., được kể là các ký·tự; dấu ngang·nối (hyphen), dấu ngang·cách (dash), dấu chấm·lơ (intrapunct) và dấu cách·từ (space) hay khoảng trắng (white space) được kể là các ký·tự.
* ký·tự Trung·hoa (Hán-tự, Chinese character) ví·dụ như 爬, 疤, 笆, 羓, 豝, vv.
* chữ·cái (letter)— ký·tự in·được (printable character) được sử·dụng để đại·diện cho mỗi âm·vị (phoneme)— được kể là ký·tự.
* “một tổ·hợp gồm chữ·cái nguyên·âm (a, ă, â, e, ê, i, o, ô, ơ, u, ư và y) và dấu·thanh”—   còn có tên·gọi là “ký·tự Việt” hay  “ký·tự La·tinh Nới·dài Bổ·sung” (Latin Extended Addtional character)— được kể là “một ký·tự”, ví·dụ á, à, ả, ã và ạ; ằ, ẳ, ẵ, ắ và ặ, vv., được kể là ký·tự. Trong unicode, chẳng·hạn, từ·ngữ “Hòa” và “Hoà” là hai từ khác nhau. “H-ò-a” được biểu·thị bằng “0x48-0xF2-0x391”, trong·khi·đó “H-o-à” được biểu·thị bằng “0x48-0x3BF-0xE0”.

Hai cách viết— viết luông·tuồng và viết phân·biệt từ và âm·tiết— cho chúng·ta hai kết·quả sai·biệt như sau:

A. Nếu chúng·ta viết các từ·ngữ Việt một·cách luông·tuồng, không đầu không đuôi như hiện nay, chương·trình đếm từ·ngữ sẽ cho chúng·ta kết·quả là toàn bài·viết có 668 chữ·viết (script), và tất·cả chữ·viết đều được viết rời·rạc. Chúng·ta khó có·thể phân·biệt các chữ·viết đó là âm·tiết (syllable), hoặc hình·vị (morpheme), hoặc từ đơn·âm·tiết (monosyllablic word), và như·thế các từ khép, từ ghép, cụm·từ, cụm·từ cố·định, vv., không·được·biết·tới (unknown).

B. Nếu chúng·ta theo cách viết Tiếng Việt·nam đa·âm·tiết bằng cách thêm dấu chấm·lơ “·” (intrapunct) hay “intraword separation mark” để nối liền các âm·tiết của một từ, và dấu·ngang·nối “-” (hyphen) đề nối liền các từ·ngữ (từ ghép hoặc cụm·từ cố·định), và dấu cách·từ (space or white space) đề phân·cách các từ·ngữ, toàn bài·viết được máy điện·toán đếm tổng·cộng là 548 từ·ngữ (word) và trong số 548 từ·ngữ này, số·lượng từ khép, từ ghép, cụm·từ, cụm·từ cố·định, vv., được tính chính·xác là 120 (=2623-2503) hay (=668-548) từ·ngữ, Cụ·thể gồm:
a. từ đơn·âm·tiết (monosyllabic word), ví·dụ: Tổng·cộng các từ·ngữ gồm “những”, “của”, “việc”, “ghi”, và “theo” được tính là năm từ.
b. từ lưỡng·âm·tiết (disyllabic word), ví·dụ: Tổng·cộng các từ·ngữ gồm “lợi·ích”, “cải·cách”, “văn·tự”, và “khuôn·phép” được tính là bốn từ.
c. song·âm·tiết (bisyllabic word), ví·dụ: Tổng·cộng các từ·ngữ gồm “hoàn·tất” và “xinh·đẹp” được tính là hai từ.
d. đa·âm·tiết (polysyllabic word), ví·dụ: Tổng·cộng các từ·ngữ gồm “lí·la·lí·lắc” và “lu·xu·bu” được tính là hai từ.
e. “từ khép” hay “từ ghép dạng kín” (closed form compound word), ví·dụ: Tổng·cộng các từ·ngữ gồm “áo·dài” (Vietnamese ao-dai), “cà·chua” (tomato), và “sung·sướng” (happy) được tính là ba từ.
f. “từ ghép dạng mở” (open form compound word), ví·dụ: Tổng·cộng các từ·ngữ gồm “cách viết chữ Việt” và “máy cắt cỏ” được tính là bảy từ. Tổng·cộng các từ·ngữ gồm “áo dài” (long dress) và “cà chua” (loại cà có vị chua) được máy điện·toán đếm là bốn từ.
g. “từ ghép dạng viết·nối·ngang” (hyphenated form word), ví·dụ: Tổng·cộng các từ·ngữ gồm “ăn-bao-bụng” (all-you-can-eat) và “ăn-trong-xe” (eat-in-the-car) được tính là hai từ.
h. cụm·từ cố·định (fixed phrase), ví·dụ như “máy bay lên thẳng”— không dùng dấu·ngang·nối (hyphen)— được máy điện·toán coi·như (consider) “một nhóm từ” (a group of word), và đếm là bốn từ, nhưng nếu viết theo dạng viết·nối·ngang, ví·dụ như “máy-bay-lên-thẳng”; cụm·từ này sẽ được máy điện·toán đếm là một từ (cụm·từ) thay·vì một nhóm từ. Như·vậy, tổng·cộng các từ·ngữ “helicopter”, “trực·thăng” và “máy-bay-lên-thẳng” sẽ được chương·trình đếm từ·ngữ trên máy điện·toán cho kết·quả tổng·cộng là ba từ nếu chúng·ta sử·dụng dấu·chấm·lơ “·” hoặc dấu·ngang·nối “-“.

Thống·kê số·lượng chữ·cái·đôi (digraph) nói chính·xác hơn là phụ·âm·đôi (consonant digraph) được sử·dụng trong bài·viết:
49 (49%) ng đại·diện cho âm·vị /ŋ/.
28 (6%) ch đại·diện cho âm·vị /t͡ɕ/.
18 (4%) th đại·diện cho âm·vị /tʰ/.
10 (2%) nh đại·diện cho âm·vị /ɲ/.

– – · o O o · – –

Xem cả bài·viết (the whole article): Hợp·thức·hoá việc thêm chữ·cái F, J, W và Z vào bảng·chữ·cái Tiếng Việt.
https://tiengvietmenyeu.wordpress.com/2012/01/23/hop-thuc-hoa-viec-them-chu-cai-f-j-w-va-z-vao-bang-chu-cai-tieng-viet/

NỘI·DUNG.

I. Bốn ký·tự (character) F, J, W và Z là bốn chữ·cái (letter) chính·thức nằm trong hệ·thống chữ biểu·âm La·tinh tiêu·chuẩn và tự·thân·chúng (themselves) không là ký·hiệu toán·học, ký·hiệu hoá·học, vv.

II. Thêm bốn chữ·cái F, J, W, Z vào bảng·chữ·cái Tiếng Việt là cần·thiết và nên làm vì các lý·do sau·đây:
1. Bốn chữ·cái F, J, W và Z ảnh·hưởng mật·thiết đến giao·tiếp xã·hội và cuộc·sống hằng·ngày.
2. Giúp dễ·dàng hơn việc phiên·âm tên gọi của các đơn·vị đo·lường, các thuật·ngữ khoa·học mới.
3. Việt·hoá một số·lượng khá lớn các thuật·ngữ quốc·tế được dễ·dàng hơn, hoà·nhập chúng vào như một phần của Tiếng Việt nhưng vẫn giữ được tính quốc·tế.
4. Giúp thống·nhất việc phiên·âm tên riêng, địa-danh nước·ngoài, giúp việc giao·tiếp, hợp·tác quốc·tế được dễ·dàng hơn.
5. Giúp Người Việt·nam sinh·sống ở nước ngoài, cũng như người nước·ngoài giao·tiếp bằng Tiếng Việt được dễ·dàng hơn.

III. Bốn chữ·cái F, J, W và Z sẽ mang tên gì, dùng để ghi âm gì và được ráp·vần như thế·nào trong Tiếng Việt?

IV. Chúng·ta thêm các chữ·cái F, J, W và Z vào bảng·chữ·cái Tiếng Việt nhưng vẫn giữ nguyên như cũ các phụ·âm kép truyền·thống “Ph”, “Gi”, “Qu” và “D”. Thêm bốn chữ·cái F, J, W và Z nhằm mục·đích phiên·âm tên riêng nước·ngoài, làm·cho Tiếng Việt thêm chính·xác và thêm phong·phú, chứ không nhằm cải·tiến (improve), hoặc cải·cách (reform) Việt-ngữ.

V. Nhật·bản đã phải thêm 48 mẫu·tự katakana cách đây khá lâu để giải·quyết cùng một vấn·đề hội·nhập, trong·khi chúng·ta chỉ cần thêm 4 chữ·cái (letter) F, J, W và Z vào trong cùng bảng·chữ·cái (alphabet) hiện·hành.

VI. Thêm bốn Chữ·cái F, J, W, Z vào bảng·chữ·cái Tiếng Việt không nhằm mục·đích phục·vụ cho lối khõ Telex trên máy điện·toán.

Tham·khảo:
Phân·biệt intrapunct (intraword separation mark) và  interpunct (interword separation mark).
http://www.unicode.org/L2/L2009/09332-n3694.pdf

https://en.wikipedia.org/wiki/Script_(Unicode)
http://www.ancientscripts.com/chinese.html

http://www.languageinindia.com/sep2001/jcscript.html
https://en.wikipedia.org/wiki/Help:IPA_for_Vietnamese

character-based
http://www.webopedia.com/TERM/C/character_based.html

Unicode lookup.
http://unicodelookup.com/#j/1
http://unicodelookup.com/#ʝ/1

Examples of Consonant Blends
http://examples.yourdictionary.com/examples-of-consonant-blends.html

script.
https://en.wiktionary.org/wiki/script

Advertisements

Trả lời

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Đăng xuất / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Đăng xuất / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Đăng xuất / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Đăng xuất / Thay đổi )

Connecting to %s

%d bloggers like this: