Từ Việt·nồm hay từ Nồm là gì?

Từ Việt·nồm hay từ Nồm là gì?
Đặng Hải Nguyên.

Người Việt (Vietnamese) từ ngàn xưa đã có tiếng·nói riêng của mình. Tiếng Việt (Vietnamese) có từ·pháp riêng, ngữ·pháp riêng, cú·pháp riêng, văn·phạm riêng và có cả chữ·viết (script) riêng— đó là chữ “nòng·nọc”— trước khi bị Trung·hoa đô·hộ.

Tiếng Nôm là tiếng thường được chúng·ta gọi là tiếng thuần Việt— gồm tiếng Kinh (Việt) và tiếng gốc Nam-Á— chúng·ta có 7.164 tiếng Nôm đơn (chỉ tính những tiếng có·ý·nghĩa và  chưa tính những tiếng không·ý·nghĩa) và được ghi bằng 31.577 Nôm-tự hay ký·tự Nôm (Nôm character) tuỳ theo ý·nghĩ của mỗi tiếng. Ví·dụ:
Tiếng (sound) ‘lu·xu·bu’ là một tiếng Nôm có·ý·nghĩa, do ba tiếng không·ý·nghĩa ‘lu’, ‘xu’ và bu’ hợp·thành. Các nhà ngôn·ngữ (linguist) gọi “lu·xu·bu” là từ đa·âm·tiết (polysyllabic word), nói chính·xác hơn là từ tam·âm·tiết (trisyllabic word) gồm·có ba âm·tiết (syllable) ‘lu’, ‘xu’ và bu’.
Tiếng ‘rực·rỡ’ là một tiếng Nôm có·ý·nghĩa, do hai tiếng ‘rực’ và ‘rỡ’ hợp·thành. Các nhà ngôn·ngữ gọi từ “rực·rỡ” là từ lưỡng·âm·tiết (disyllabic word) gồm·có ‘rực’ là âm·tiết có·ý·nghĩa (meaningful syllable) và ‘rỡ’ là âm·tiết  không·ý·nghĩa (meaningless syllable).
Cùng một tiếng (sound) ‘rực·rỡ’, nhưng ngày nay và ngày xưa ghi bằng hai loại chữ·viết (script) khác nhau. Ngày nay, sử·dụng hệ·thống chữ·viết dùng chữ·cái (quốc-ngữ nay) để ghi tiếng Việt, chúng·ta ghi là “rực·rỡ”. Ngày xưa, sử·dụng “hệ·thống chữ·viết dùng ký·tự Hán” (Chinese character script system) để ghi tiếng Việt, chúng·ta  ghi là “𤊧 𠒦”; đây là Nôm-tự (quốc-ngữ xưa), chữ Việt, do Người Việt·nam tạo·ra, không phải chữ Hán. Người Trung·hoa (Chinese) có xem cũng chẳng hiểu là gì. Nó chẳng khác gì khi ta so·sánh từ “rực·rỡ” với “rucro” trong “hệ·thống chữ·viết dùng chữ·cái (alphabetic script system) La·tinh hoặc hy·lạp! Người Anh, Người Pháp có đọc, hoặc xem “rucro” cũng chẳng hiểu gì cả! Xem tiếp

Khái·lược Về Văn·học Chữ Nôm Ở Việt Nam

Khái Lược Về Văn Học Chữ Nôm Ở Việt Nam – GS. TSKH. Nguyễn Quang Hồng
 

Ngay từ đầu Công nguyên cho đến suốt 1000 năm Bắc thuộc sau đó, các dân tộc trên đất nước Việt Nam đã sống trong quá trình cộng cư với nhau và cả với người Hán từ phương Bắc đến. Trải qua quá trình cộng cư này cùng với sự tiếp xúc với chữ Hán và văn hóa Hán, các dân tộc Việt Nam đã dần dần chủ động sử dụng chữ Hán trước hết là trong hành chính và trong giáo dục, rồi cả trong sáng tác văn học, hình thành một nền văn học chữ Hán của chính dân tộc mình. Và từ khi thoát li khỏi sự đô hộ trực tiếp của phong kiến phương Bắc, thì bên cạnh chữ Hán vẫn tiếp tục được coi trọng, người dân bản địa Việt Nam còn sáng tạo ra chữ viết cho bản ngữ của mình. Đó là các hệ thống chữ viết ô vuông theo hình mẫu chữ Hán, được gọi là chữ Nôm: Người Kinh (tộc người Việt) có chữ Nôm Việt, người Tày có chữ Nôm Tày, v.v.

Với chữ Nôm Việt, ở Việt Nam đã hình thành nên một nền văn chương chữ Nôm (bên cạnh văn chương chữ Hán). Và chính trong lĩnh vực sáng tạo văn học, chữ Nôm gắn liền với ngôn ngữ dân tộc đã tạo nên những tác phẩm có giá trị, chiếm những vị trí cao nhất trong văn học cổ điển Việt Nam. Xin trình bày đôi nét khái quát về những chặng đường hình thành các thể thức và thể loại cùng với những tác giả và tác phẩm tiêu biểu của nền văn học chữ Nôm tiếng Việt.

Xem tiếp

Hãy trả·lại ý·nghĩa đích·thực của “từ Hán-Việt”

Hãy trả·lại ý·nghĩa đích·thực của “từ Hán-Việt”

1. Tiếng/từ Hán-Việt theo đúng ý·nghĩa là gì?
2. Tiếng/từ Việt·nồm hay tiếng/từ Nồm là gì? Chúng khác với tiếng/từ Hán-Việt ra·sao?
3. Người Nhật tuy sử·dụng một phần Hán-tự trong chữ·viết Kan·ji của họ, nhưng văn·hoá Nhật không hề bị vẩn·đục với những lợn·cợn Trung·hoa.

Hãy trả·lại ý·nghĩa đích·thực của “từ Hán-Việt” và gọi các tiếng Hán đã được Việt·hoá với âm·hưởng Việt hoàn·toàn bằng tên mới là “tiếng Việt·nồm” hay tiếng Nồm (post-Nôm), và chữ·viết dùng chữ·cái La·tinh — cách viết khác hoàn·toàn với chữ Trung·hoa (Hán-tự) —để biểu·thị “tiếng Việt·nồm” hay “tiếng Nồm” là “từ Việt·nồm” hay “từ Nồm” (post-Nôm). Xem tiếp

Cần tiếp·tục giải·mã chữ Việt cổ

Cần tiếp tục giải mã chữ Việt cổ
Trần Thi

Khái lược về chữ Việt cổ:

Từ hàng nghìn năm qua, các nhà khoa học trong và ngoài nước đều khẳng định: Việt Nam có chữ viết từ rất sớm, trước chữ Hán cả nghìn năm và hoàn toàn khác chữ Hán. Các nhà nghiên cứu, Anh, Tiệp xác nhận: “Ngay từ trước công nguyên, người Việt đã có chữ tượng thanh – loại chữ ghép chữ cái thành từ”. Điều này được thể hiện trên các di chỉ khảo cổ đồ gốm, đồ đồng của thời kỳ Đông Sơn như: lưỡi cày, lưỡi xéo, đặc biệt là trống đồng…cùng các hình vẽ chữ viết trên đá cổ Sa Pa, Xín Mần. Pá Màng… theo một hệ thống nhất quán, tất cả đều thể hiện đó là những chữ viết cổ từ thời kỳ tiền văn tự, phát triển và hoàn thiện dần thành bộ chữ “khoa đẩu”. Xem tiếp

Chữ Việt cổ đã được giải·mã.

Chữ Việt cổ đã được giải mã.

Chiều 29/1/2013, tại 80 Lý Thường Kiệt, Hà Nội, nhà nghiên cứu Đỗ Văn Xuyền đã có buổi mắt cuốn sách “Cuộc hành trình đi tìm chữ Việt cổ” và giao lưu với các nhà nghiên cứu, những người say mê chữ Việt cổ.
Năm 2011, Báo điện tử VTC News đã có loạt phóng sự về hành trình gian nan nửa thế kỷ nghiên cứu chữ Việt cổ của ông Đỗ Văn Xuyền.

Ông Xuyền tuyên bố rằng đã giải mã được chữ Việt cổ – thứ chữ của một nền văn minh rực rỡ từ thời các Vua Hùng dựng nước Văn Lang. Xem tiếp

Bỏ Hán-tự là một tai·hoạ hay một đại-phước?

Bỏ Hán-tự là một tai·hoạ hay một đại-phước?

Người Việt bỏ Hán-tự quả·thật là một tai·hoạ chăng? Hán-tự có·thể sẽ trở·thành chữ·quốc·tế, một thứ esparento cho cả nhân·loại? Việc đem Hán-tự (Chinese character) hay chữ Hán (Chinese script) trở·lại Nước Việt Nam (Vietnam) nếu thành·công sẽ là một đại-phước cho… dân Việt?

Tiếng·nói của loài·người đã có từ·lúc con·người còn ăn·lông-ở·lổ, sống cuộc·sống bầy·đàn, là phương·tiện giao·tiếp để sinh·tồn, chống·lại thú dữ và tai·hoạ tự·nhiên. Thời·kỳ sơ·khai, con·người chỉ biết đến bản·thân như ăn, uống, mắt, mũi, vui, buồn, vv. (etc.), và những hình·ảnh cụ·thể quanh mình như nước, sông, đất, núi, vv., cùng những hiện·tượng tự·nhiên ảnh·hưởng trực·tiếp đến mình như mưa, gió, sấm, sét, vv. Con·người vẫn·còn sống cuộc·sống bầy·đàn như những loài·vật khác nếu không có tiếng·nói. Tiếng·nói đã góp·phần không nhỏ trong việc hình·thành xã·hội loài·người; khi cuộc·sống xã·hội của loài·người, trong·đó có cả phần tiếng·nói, phát·triển cao·hơn, chữ·viết được phát·minh, khởi·đầu bằng những hình·vẽ mang tính tượng·trưng như sông, núi, đực, cái, vv., mà chúng·ta thấy nhiều vết·tích còn lưu·lại trong hệ·thống chữ·viết biểu·ý, chẳng·hạn ký·tự “馬, mã” là hình·vẽ tượng·trưng cho con ngựa có bờm và bốn chân, ký·tự “女, nữ” là hình·vẽ khó nói nên lời… dần·dà sau·đó một hệ·thống chữ·viết dựa trên âm·thanh xuất·hiện, khởi·đầu bằng những âm·thanh đơn·giản, mỗi âm·thanh được con·người gán·cho một ý·nghĩa nào·đó, sau·đó  những tiếng gồm hai âm·thanh, rồi ba âm·thanh…  xuất·hiện trong tiếng·nói, nhưng cũng để chỉ một nghĩa, một khái·niệm, vv. Khi con·người sống thành xã·hội, nhiều nhu·cầu được đặt·ra, điều này đã khiến nảy·sinh ra nhiều khái·niệm mới cần·thiết trong giao·tiếp xã·hội, ngôn·ngữ mới phức·tạp hơn với những quy·định (regulation), quy·tắc, nguyên·tắc… giúp người khác hiểu rõ, hiểu đúng sự·vật, sự·việc, khái·niệm, ý muốn, vv., mà người này muốn truyền·đạt cho người kia. Xem tiếp

Nên viết thế·nào cho đúng: “tiếng Việt” hoặc “Tiếng Việt”, “ngôn ngữ tiếng Việt” hoặc “ngôn ngữ Việt”?

Nên viết thế·nào cho đúng: “tiếng Việt” hoặc “Tiếng Việt”, “ngôn ngữ tiếng Việt” hoặc “ngôn ngữ Việt”?

Trong câu·văn “ngôn ngữ quốc gia là tiếng Việt”, từ “tiếng Việt” ở đây được hiểu (hoặc phải hiểu) là nó bao·gồm cả “tiếng·nói Việt” và “chữ·viết Việt”. Thế·nhưng, từ “tiếng” thường khiến người·ta chỉ liên·tưởng đến hoặc chỉ nghĩ đến “tiếng·nói” mà·thôi, vậy chúng·ta phải làm gì và viết như thế·nào để nó bao·gồm luôn cả phần chữ·viết?
Xem tiếp

Thuật·toán tách từ

Thuật toán tách từ
Tác giả: Lưu Tuấn Anh.

Nội dung

1. Các hướng tiếp cận
2. Các phương pháp được sử dụng
3. Ứng dụng bài toán tách từ
4. Thuật toán phổ biến
5. Một số vấn đề mở rộng

Tách từ là một quá trình xử lý nhằm mục đích xác định ranh giới của các từ trong câu văn, cũng có thể hiểu đơn giản rằng tách từ là quá trình xác định các từ đơn, từ ghép… có trong câu. Đối với xử lý ngôn ngữ, để có thể xác định cấu trúc ngữ pháp của câu, xác định từ loại của một từ trong câu, yêu cầu nhất thiết đặt ra là phải xác định được đâu là từ trong câu. Vấn đề này tưởng chừng đơn giản với con người nhưng đối với máy tính, đây là bài toán rất khó giải quyết.

Chính vì lý do đó tách từ được xem là bước xử lý quan trọng đối với các hệ thống Xử Lý Ngôn Ngữ Tự Nhiên, đặc biệt là đối với các ngôn ngữ thuộc vùng Đông Á theo loại hình ngôn ngữ đơn lập, ví dụ: tiếng Trung Quốc, tiếng Nhật, tiếng Thái, và tiếng Việt. Với các ngôn ngữ thuộc loại hình này, ranh giới từ không chỉ đơn giản là những khoảng trắng như trong các ngôn ngữ thuộc loại hình hòa kết như tiếng Anh…, mà có sự liên hệ chặt chẽ giữa các tiếng với nhau, một từ có thể cấu tạo bởi một hoặc nhiều tiếng. Vì vậy đối với các ngôn ngữ thuộc vùng Đông Á, vấn đề của bài toán tách từ là khử được sự nhập nhằng trong ranh giới từ. Xem tiếp

Ứng·dụng phương·pháp Pointwise vào bài·toán tách từ cho Tiếng Việt

Ứng dụng phương pháp Pointwise vào bài toán tách từ cho tiếng Việt

Lưu Tuấn Anh, Yamamoto Kazuhide

Natural Language Processing Laboratory Department of Electrical Engineering
Nagaoka University of Technology 940-2188, Nagaoka City, Niigata, Japan

Abstract
Trong tiếng Việt, dấu cách (space) không được sử dụng như 1 kí hiệu phân tách từ, nó chỉ có ý nghĩa phân tách các âm tiết với nhau. Vì thế, để xử lý tiếng Việt, bài toán tách từ (word segmentation) là 1 trong những bài toán cơ bản và quan trọng bậc nhất. Ngoài tiếng Việt, có khá nhiều các ngôn ngữ châu Á khác cũng cần bước tách từ, ví dụ như: tiếng Nhật, tiếng Trung, tiếng Hàn,… do đó vấn đề này nhận được sự quan tâm rộng rãi và có nhiều hướng tiếp cận khác nhau. Bài viết này sẽ tập trung phân tích hướng tiếp cận pointwise dựa trên máy học SVM: phân loại từng dấu cách một cách độc lập vào 2 loại: SPACE (kí hiệu tách từ) và UNDERSCORE (kí hiệu liên kết 2 âm tiết). Với phương pháp này, chúng tôi đã đạt được độ chính xác 98.2% trong thực nghiệm. Tất cả mã nguồn của nghiên cứu này được ứng dụng để tạo ra công cụ mang tên Đông Du.

Keywords: xứ lý ngôn ngữ tự nhiên, xử lý tiếng Việt, bài toán tách từ, pointwise estimation

I. INTRODUCTION

Trong tiếng Việt, dấu cách không mang ý nghĩa phân tách các từ mà chỉ mang ý nghĩa phân tách các âm tiết với nhau. Ví dụ: từ “đất nước” được tạo ra từ 2 âm tiết “đất” và “nước”, cả 2 âm tiết này đều có nghĩa riêng khi đứng độc lập, nhưng khi ghép lại sẽ mang một nghĩa khác. Vì đặc điểm này, bài toán tách từ trở thành 1 bài toán tiền đề cho các ứng dụng xử lý ngôn ngữ tự nhiên khác như phân loại văn bản, tóm tắt văn bản, máy dịch tự động,…

Ngoài tiếng Việt, có khá nhiều các ngôn ngữ khác cũng gặp phải bài toán này, ví dụ như: tiếng Nhật, tiếng Trung, tiêng Hàn,… Mỗi một ngôn ngữ có 1 đặc điểm cú pháp khác nhau, nhưng nhìn chung, hướng tiếp cận chủ đạo ở tất cả các ngôn ngữ này là sử dụng máy học.
Xem tiếp

Tìm hiểu nghĩa của các âm·tiết Việt·nồm trong các từ kép: ÂN·CẦN, BỐ·THÍ, ĐÔ·HỘ…

Tìm hiểu nghĩa của yếu tố Hán Việt trong các từ: ÂN CẦN, BỐ THÍ, ĐÔ HỘ…

PGS. TS. LÊ XUÂN THẠI

SUMMARY
The author surveys, explores (via references to the interpretations by some previous authors) and provides satisfactory explanations for a number of words of Chinese origin used in communication in Vietnamese today: ân cần, bố thí, đô hộ, hồn nhiên, hưu trí, Nghệ An, phương phi, truyền lô, trực nhật, vân vi…
ÂN CẦN  Nguyễn Lân giải thích ân (殷) có nghĩa là “chu đáo”, cần (勤) có nghĩa là “gắn bó”. Còn Thiều Chửu thì không giải thích rõ nghĩa của hai yếu tố này. Từ điển yếu tố Hán Việt thông dụng giải thích ân là “chu đáo, quan tâm đến”. Giải thích như Nguyễn Lân và các tác giả Từ điển yếu tố Hán Việt thông dụng là chưa được hoàn toàn chính xác. Ân trong Giáp cốt văn vẽ một người có bụng trướng và một bàn tay cầm kim châm để chữa bệnh. Nghĩa ban đầu của ân là “bệnh nặng”, về sau phái sinh thêm những nghĩa mới là “to lớn”, “sung túc” và từ các nghĩa đó phái sinh nghĩa “tình cảm nồng đậm” tức là “nhiệt tình”. Cần cũng có nhiều nghĩa trong đó có nghĩa là “chu đáo”. Chính vì nghĩa của âncần trong từ ân cần là như vậy nên Hiện đại Hán ngữ từ điển định nghĩa ân cần là “nhiệt tình và chu đáo”.
Xem tiếp