Tiếng Việt là một ngôn ngữ đơn lập, có thanh điệu, thuộc nhóm Việt-Mường (hay còn gọi là Vietic) của ngữ hệ Nam Á, điểm độc đáo của nó so với các ngôn ngữ của các nước thuộc lục địa Viễn Đông là có một hệ thống chữ cái kiểu La-tinh: chữ Quốc ngữ (chữ viết của ngôn ngữ quốc gia).
Chữ Hán vẫn được sử dụng trong các nghi lễ [tôn giáo] và hiện diện trên các di tích Phật giáo, nhất là ở miền Bắc và miền Trung Việt Nam, nhưng chữ viết chính thống là chữ viết “La-tinh hóa” dùng trong đời sống hằng ngày, trong báo chí và sách vở hoặc trong giảng dạy.
Việc sử dụng một bảng chữ cái vay mượn phần lớn từ bảng chữ cái La-tinh và nhiều ngôn ngữ nhóm Rôman mà chủ yếu từ bảng chữ cái tiếng Bồ Đào Nha, là một hiện tượng hiếm gặp ở các quốc gia châu Á chịu ảnh hưởng về chính trị và văn hóa Trung Hoa và thấm nhuần Khổng giáo. Bảng chữ cái độc đáo này được sáng tạo vào nửa đầu thế kỷ 17 nhờ công lao của các nhà truyền giáo Dòng Tên cư trú ở Đàng Trong, rồi Đàng Ngoài, [bên cạnh việc tạo ra bảng chữ cái], họ còn tiến hành thêm các công trình mô tả tiếng Việt – những công trình liên quan đến thứ gọi là ngữ pháp hóa.
Các nghiên cứu về ngữ pháp hóa ngôn ngữ, dù được thực hiện trước hay sau khi Sylvain Auroux đưa ra khái niệm này trong lĩnh vực nghiên cứu lịch sử tri thức luận các tư tưởng về ngôn ngữ, các công trình này (trong đó có tiếng Việt) đều hướng đến nhiều nghiên cứu về lịch sử và/hoặc ngôn ngữ sẽ được chúng tôi trình bày nhằm xác định vị trí của nghiên cứu này. Auroux định nghĩa ngữ pháp hóa là quá trình “mô tả và cung cấp công cụ cho ngôn ngữ dựa trên hai nền tảng căn bản là ngữ pháp và từ điển, mà chúng vẫn còn là những trụ cột cho tri thức về siêu ngôn ngữ của chúng ta”.
Có một giai đoạn tiền ngữ pháp hóa tồn tại trước quá trình này rất lâu và đã dẫn đến sự hình thành những chữ viết đầu tiên – là hệ quả và đồng thời là điều kiện của một phản ảnh về các thuộc tính ngôn ngữ loài người – tuy nhiên cần phân biệt nó với ngữ pháp hóa đúng nghĩa. Công cụ của ngữ pháp hóa đã được sử dụng để mô tả một số lượng rất lớn các ngôn ngữ bản xứ theo mô hình “ngữ pháp La-tinh mở rộng” (Auroux). Cuộc cách mạng kỹ thuật-ngôn ngữ này trước hết nhắm tới những ngôn ngữ ở Tây Âu và Trung Âu song dần dần nó đã lan tỏa đến gần như tất cả các ngôn ngữ trên thế giới.
Như vậy ngữ pháp hóa tiếng Việt là kết quả của một trào lưu mang tính toàn cầu. Từ thời Phục hưng, các giáo sĩ Ki-tô giáo được cử đi truyền giáo ở Tân Thế giới mà không được đào tạo trước về nghiên cứu ngôn ngữ, hành trang “ngôn ngữ” chính của họ là kiến thức cơ bản về ngữ pháp La-tinh, được tiếp thu trong chủng viện và trường Dòng. Các phương pháp thu thập và xử lý dữ liệu ngôn ngữ và – ta có thể gọi là phương pháp “dân tộc học” – chủ yếu do thừa sai José de Acosta (1588) khởi xướng, đầu tiên phương pháp này được áp dụng ở châu Mỹ và sau đó gần như cùng thời điểm cũng được áp dụng ở Đông Á.
Đứng trước nhu cầu giao tiếp với dân chúng bản địa, các nhà truyền giáo phải học ngôn ngữ và, trong khi mô tả nó theo mô hình ngữ pháp La-tinh thì họ ghi các âm ngôn ngữ đó bằng các chữ cái gọi là chữ La-tinh. Như vậy trong lịch sử lâu dài của ngữ pháp hóa, cuộc cách mạng công nghệ [trong ngành ngôn ngữ] thường đi kèm với việc biên soạn ngữ pháp và từ điển, quá trình này trùng khớp với giai đoạn tiền ngữ pháp hóa, tức giai đoạn khởi thủy của chữ viết, hoặc chí ít cũng trùng khớp ở một số khía cạnh. Đây chính là trường hợp sáng tạo ra chữ viết hệ La-tinh của tiếng Việt được các giáo sĩ Dòng Tên tiến hành.
Không phải ngôn ngữ này chưa từng có hệ thống chữ viết; nó thậm chí có hai hệ thống đều là dạng tượng hình: chữ Hán (dựa trên chữ viết Trung Hoa) mượn từ Trung Hoa và một loại văn tự bình dân là quốc âm (tiếng nói quốc gia), sau này gọi là chữ Nôm (chữ viết của người phương Nam) – hệ chữ viết riêng của dân tộc.
Chữ Hán và kinh điển Nho giáo đồng thời được du nhập vào Đại Việt (quốc hiệu của Việt Nam lúc bấy giờ) khi bị Đế quốc Trung Hoa nắm quyền kiểm soát chính trị dưới thời nhà Hán, kể từ năm 111 trước Công lịch. Về chữ Nôm, nó được người Việt sáng tạo trong thế kỷ 9 – 10 bằng cách điều chỉnh chữ Hán cho phù hợp với một vài đặc điểm ngữ âm của tiếng Việt. Phải đến thế kỷ 11, tức là hơn một thế kỷ sau khi đất nước dần dần thoát khỏi sự đô hộ của Trung Hoa thì chữ viết này mới thực sự phát triển.
Tuy nhiên, việc chuyển đổi sang một hệ thống chữ viết hoàn toàn khác biệt, trường hợp chữ viết hệ La-tinh của tiếng Việt không phải một cuộc chuyển đổi đơn thuần từ mẫu tự này sang mẫu tự khác trong cùng một hệ thống như từ chữ Hán sang chữ Nôm, hay – một ví dụ tương tự – từ chữ Ottoman Thổ Nhĩ Kỳ (biến thể của chữ Ả Rập) sang phiên bản cải biên từ mẫu tự gọi là La-tinh trong cuộc cải cách của Atatürk vào đầu thế kỷ 20.
Việc tạo ra chữ viết cho một ngôn ngữ chưa từng có chữ viết, như phần lớn trường hợp ở Tân Thế giới, hay cho một ngôn ngữ đã có văn tự như trường hợp của Việt Nam chính là sáng tạo một thứ kỹ thuật mà chính nó đã tiền giả định ít nhiều một cách có ý thức, nghĩa là theo phương thức luận ngôn ngữ, hoặc mô tả một cách tường minh theo lối siêu ngôn ngữ các thuộc tính âm vị học của một ngôn ngữ mà người ta trao cho ngôn ngữ đó chữ viết mẫu tự La-tinh.
Một công cuộc như thế lại càng có ý nghĩa đối với ngôn ngữ học lịch sử và lịch sử ngôn ngữ học ở chỗ nó đề cập đến hình thái cổ xưa của ngôn ngữ (ở đây là tiếng Việt trung đại), một hình thái ngôn ngữ mà chúng ta không có thông tin gì ngoài những thông tin được cung cấp gián tiếp bởi cách ghi âm theo bảng chữ cái La-tinh này. Công cuộc ấy rất đáng quý, hơn nữa còn vì việc phiên âm bằng mẫu tự gọi là La-tinh (hay văn tự La-tinh hóa) được tiến hành bằng phương tiện của loại hình chữ viết vốn đã khá hoàn chỉnh – ít nhất là một phần – là để trang bị cho một (thậm chí nhiều) ngôn ngữ khác một bảng chữ cái, điều này cho phép nhà nghiên cứu khai mở tiềm năng khám phá của ngành ngôn ngữ học đối chiếu.
Một ngôn ngữ khác nghĩa là sao?
Trong trường hợp chúng ta đang xem xét thì đó hẳn nhiên là tiếng Bồ Đào Nha vào đầu thế kỷ 17, đã có rất nhiều mô tả âm vị học của ngôn ngữ này từ thời đó và một chút tiếng Ý. Những mô tả này sẽ cho phép ta xác minh giá trị ngữ âm chuẩn của các ký hiệu mà các Cha Dòng Tên sử dụng, đặc biệt là những người dùng tiếng Bồ Đào Nha làm ngôn ngữ tham chiếu bởi đó là tiếng mẹ đẻ của họ (như Pina, Fontes, Amaral…) hoặc là ngôn ngữ dùng để làm việc (như Borri, de Rhodes…).