Urbanist Vietnam

BackĐời Sống » Công Nghệ » Gõ tiếng Việt, Phần 2: Người Việt xa xứ, Unicode và Sự phổ biến của Unikey

Gõ tiếng Việt, Phần 2: Người Việt xa xứ, Unicode và Sự phổ biến của Unikey

Đây là phần 2 của bộ bài viết về lịch sử công nghệ gõ chữ tiếng Việt. Độc giả có thể đọc phần 1 tại đây.

Vọng âm từ hải ngoại: Cộng đồng ảo thời đầu và sự xuất hiện của VIQR

Sau năm 1975, có một làn sóng người Việt Nam di cư đến Bắc Mỹ, châu Âu, Hồng Kông, Trung Quốc và Úc. Tại Hoa Kỳ, dân số nhập cư Việt Nam trước đó chỉ tầm vài nghìn người đến năm 1980 đã tăng lên thành 245.025 người. Đến năm 1990, con số này tăng gấp đôi thành 593.213 và đến năm 2000 đã lên đến 1.122.528. Xa rời đất mẹ và chịu sự lề hoá nơi đất khách quê người, những người Việt tha hương luôn khát khao được hàn gắn sợi dây cội nguồn và văn hoá bị đứt gãy. Tiếng Việt là kết nối cụ thể nhất mà như tác giả Anh Trần đã dẫn chứng trongGiáo dục Ngôn ngữ Việt Nam tại Hoa Kỳ rằng ít năm sau 1975 có một sự tăng trưởng đột biến số lượng các trường dạy tiếng Việt ở Hoa Kỳ.

Những nỗ lực duy trì kết nối với quê nhà qua ngôn ngữ diễn ra trong thời điểm nhiều có tiến bộ công nghệ. Ngành công nghiệp máy tính chuyển dần từ máy tính lớn sang máy vi tính cá nhân. IBM đã phát hành mẫu máy tính gia đình đầu tiên vào năm 1977 với cái tên Altair 8800. Đến năm 1981, hãng bắt đầu sản xuất hàng loại máy IBM-PC, tương tự với máy tính bàn hiện đại. Máy tính dần dần trở thành một thiết bị ngày một riêng tư và cá nhân hơn.

Cộng đồng Việt kiều ở Hoa Kỳ được tiếp xúc với những tiến bộ máy tính này khá sớm. Nguyên nhân là do vào những năm 1990, có số lượng lớn dân nhập cư người Việt đặc biệt là phụ nữ giữ vị trí là những kỹ thuật viên sơ cấp ở Thung lũng Silicon, và sau này là kỹ sư trong lĩnh vực Công nghệ Thông tin. Người Việt cũng thuộc nhóm những người tiên phong về ngành này ở Úc. Một ví dụ có thể kể đến đó là chính các bạn sinh viên tại trường Đại học Quốc gia Úc đã hoàn thành dự án mang kết nối internet đến Việt Nam.

Trong cuốn sách Transnationalizing Vietnam: Community, Culture, and Politics in the Diaspora, Kiều Linh Caroline Valverde nói về lập trình viên máy tính Tín Lê, thành viên của một nhóm các nhà khoa học máy tính người Mỹ gốc Việt có chuyên về thiết lập liên kết qua mạng diện rộng. Năm 1986, nhóm này đã kiến tạo một danh sách email lấy tên là Vietnet, nhằm kết nối các cộng đồng người Việt hải ngoại thông qua giao tiếp điện tử. Trong một lần phỏng vấn với Kiều Linh Caroline, Tín Lê chia sẻ: “Thật khó để kết nối với nhau, đặc biệt là ở những khu vực có ít người Việt cư trú. Chúng tôi ai cũng mong muốn được làm quen và trò chuyện cùng nhau.”

Các quản trị viên của Vietnet sau đó đã chuyển danh sách email này đến một nhóm tin Usenet, một diễn đàn thảo luận tên là soc.culture.vietnamese (SCV). Danh sách email của Vietnet và SCV đều có trước internet vì cả hai đều dựa vào các mạng lưới nhỏ – tiền thân của mạng lưới toàn cầu. Kho lưu trữ của Google về các cuộc thảo luận nhóm tin cho thấy SCV ra đời từ rất sớm – tháng Tư năm 1991. Ta có thể tìm thấy mọi thông tin liên quan đến Việt Nam từ thi ca, lời bài hát, công thức nấu ăn, quảng cáo, tìm kiếm người thân, thông báo dự án học tập, cho đến các cuộc thảo luận về các vấn đề lớn hơn trên diễn đàn này.

Máy tính thời kỳ đó chỉ hỗ trợ tiêu chuẩn mã hóa ký tự ASCII (viết tắt của Mã tiêu chuẩn Mỹ trong Trao đổi Thông tin). Bộ mã chỉ thể hiện bảng chữ cái tiếng Anh trên máy tính và không bao gồm dấu phụ. Để liên lạc với nhau trong nhóm tin, các thành viên Vietnet và SCV đã sử dụng một bộ quy tắc cho phép các thành viên viết tiếng Việt bằng cách sử dụng các ký tự có sẵn trong ASCII để biểu thị dấu phụ của tiếng Việt. Bộ này bao gồm (. + ^? và '). Các quy tắc thường được gọi chung là quy ước Vietnet, quy ước SCV hoặc quy ước VIQR (là viết tắt của Vietnamese Quoted-Readable). Các quy ước VIQR đã trở thành tiêu chuẩn mà nhiều công dân trực tuyến Việt Nam trong thời hoàng kim của các nhóm tin và diễn đàn tin dùng, và vẫn còn được nhiều người sử dụng cho đến tận ngày nay.

Một bài đăng trên Usenet liệt kê một số tên tiếng Việt nhưng nghe như những từ mang ý tứ xúc phạm trong tiếng Anh để các bậc phụ huynh lưu tâm khi đặt tên cho con tránh bị người Mỹ chế giễu. Ảnh chụp màn hình qua Google Group.

Dòng chảy ồ ạt của các giải pháp công nghệ

Các quy ước VIQR dù tiện lợi nhưng suy cho cùng cũng chỉ là một giải pháp tạm thời vì những người chưa thạo vẫn không đọc được nội dung tiếng Việt này. Nhu cầu thiết lập một mã chuẩn cho các ký tự tiếng Việt sử dụng trên các trang web và các phông chữ vẫn luôn hiện hữu. Vì thế, vào cuối những năm 1980 và đầu những năm 1990, đã có rất nhiều phần mềm, bộ mã hóa ký tự và phông chữ tiếng Việt xâm nhập vào thế giới mạng. Có một vài giải pháp khá hữu hiệu, thế nhưng phần lớn lại đề ra một nan đề mới. Như Kim An Lieberman giải thích trong Asian America.Net: Ethnicity, Nationalism, and Cyberspace, "Vấn đề không phải là làm thế nào để đưa tiếng Việt lên internet, mà là sử dụng phiên bản tiếng Việt nào."

Thời gian này xuất hiện một tiêu chuẩn mã hóa, đồng thời cũng là một phương cách nhập liệu phổ biến: tiêu chuẩn VNI. VNI được phát triển bởi ông Hồ Thanh Việt, một kỹ sư phần mềm người Việt sinh sống tại Westminster. Năm 1987, ông Việt đề xuất sử dụng các phím số để biểu thị dấu phụ. Phương thức nhập liệu này được ông Việt và Công ty Phần mềm VNI phổ cập và biến thành một sản phẩm dưới dạng một chương trình xử lý phông chữ và văn bản, thiết kế cho hệ điều hành MS-DOS. Từ đây, VNI trở thành tiêu chuẩn cho in ấn ma trận điểm, giúp cải thiện hình thức trình bày của các tờ báo tiếng Việt ở Mỹ. VNI thậm chí còn được Microsoft áp dụng vào hệ điều hành Windows 95 vào những năm 1990. Tuy nhiên, VNI Software sau đó đã kiện Microsoft về việc sử dụng trái phép, buộc gã khổng lồ công nghệ này phải loại xoá bộ gõ này khỏi hệ điều hành của họ. Ngày nay, tiêu chuẩn VNI được dạy trong sách giáo khoa của bộ môn tin học, và vẫn được nhiều người sử dụng ở Việt Nam.

Cũng trong khoảng thời gian này Hiệp hội Unicode ra đời. Hiệp hội được thành lập vào năm 1987 tại Thung lũng Silicon với các thành viên làm việc cho nhiều công ty công nghệ như Apple, Xerox, Sun microsystems, IBM và Microsoft. Hiệp hội Unicode mong muốn đề ra một tiêu chuẩn chung để mã hóa và hiển thị mọi ngôn ngữ bao gồm cả tiếng Việt. Hiệp hội đã mở rộng tiêu chuẩn 8 bit thông dụng trong việc mã hóa ký tự bấy giờ thành bộ ký tự 16 bit để tăng số lượng ký tự có thể mang chứa.

Đối với tiếng Việt, kế hoạch ban đầu của hiệp hội này là để gán mã cho từng dấu phụ, thay vì gán mã cho một tổ hợp sẵn. Lý do là vì Unicode muốn tiết kiệm dung lượng và tránh phải mã hóa những ký tự có thể được tạo ra bằng cách kết các ký tự đã được gán mã. Tuy nhiên, trong quá trình thực hiện Unicode lại gặp phải một số vấn đề. Theo một ghi chú của Tập đoàn phi lợi nhuận Viet-Std thành lập với mục đích chuẩn hóa tiếng Việt trên máy tính, "Việc sử dụng nhiều dấu phụ trong các văn bản tiếng Việt dẫn đến nhu cầu tạo ra một bàn phím nhập liệu không cần thêm phím tắt đặc biệt nào để ‘soạn’ các chữ cái có dấu." Tiến sĩ Ngô Đình Học, một trong những thành viên của Viet-Std, cho rằng góc nhìn này khá là không công bằng bởi lẽ người Pháp và người Đức lại được hưởng đặc quyền có mọi ký tự được mã hóa sẵn trong bộ Unicode.

Tập đoàn Viet-Std đã gửi đơn khiếu nại đến Unicode để xem xét lại việc này nhưng bị từ chối với lý do ngôn ngữ tiếng Việt không có một hệ thống mã hóa ký tự thống nhất, do đó, không cần phải đảm bảo khả năng tương thích như các ngôn ngữ gốc La-tinh khác. Không chấp nhận lập luận của Unicode, Tập đoàn Viet-Std đã phát triển tiêu chuẩn mã hóa ký tự VISCII (Mã Tiêu chuẩn của Việt Nam để Trao đổi Thông tin) vào năm 1992. VISCII dựa trên nền tảng của bộ ký tự ASCII đã được chỉnh đổi, trong đó các ký tự “dễ xử" nhất trong bộ ASCII gốc được thay thế bằng các dấu phụ tiếng Việt.

Mãi đến năm 1993 Unicode mới đồng ý mã hóa mọi ký tự thuộc tiếng Việt. Từ đó trở đi, nhiều quy ước đánh máy hơn đã xâm nhập vào thế giới mạng. Vào năm 1993, tổ chức phi lợi nhuận Vietnam Professionals Society (VPS) phát hành phần mềm phương thức nhập liệu VPSKey của riêng mình, thiết kế cho hệ điều hành Windows 3.1. Cũng trong năm đó, Bộ Khoa học, Công nghệ và Môi trường của Việt Nam (nay là Bộ Khoa học và Công nghệ) đã ban hành TCVN 5712 – một tiêu chuẩn mã hoá ký tự 8-bit toàn quốc cho tiếng Việt. Mã hóa ký tự TCVN 5712 được gọi là VSCII (Mã Trao đổi Thông tin Tiêu chuẩn của Việt Nam) và bao gồm ba phiên bản: VN1, VN2 và VN3. Bộ đầu tiên là bộ ASCII đã được điều chỉnh, hai bộ còn lại sử dụng ASCII mở rộng. TCVN 5712 khi đó được sử dụng rộng rãi ở miền bắc nước ta.

Biểu đồ mã TCVN 5712: VN1 (trái); VN2 (phải); VN3 (dưới). Hình ảnh từ Văn Bản Pháp Luật.

Các trang web cuối cùng cũng có thể hiển thị đúng tiếng Việt và người dùng có thể viết tiếng Việt trên web nếu đầu ra và đầu vào tương thích với nhau. Tuy nhiên, việc gõ và đọc tiếng Việt trên máy tính vẫn là một vấn đề đau đầu do có quá nhiều giải pháp – với mỗi giải pháp cho phép từng trang web sử dụng bảng mã và phông chữ không tương thích với nhau. Do đó, những người dùng không được trang bị các công cụ phù hợp vẫn không thể đọc và viết tiếng Việt một cách dễ dàng.

Đi tìm một tiêu chuẩn thống nhất: Câu chuyện về Vietkey, WinVNKey và Unikey

Nhiều phần mềm và bộ xử lý văn bản vẫn tiếp tục sử dụng mã hóa ký tự tiếng Việt 7 bit và 8 bit trước khi Microsoft Windows đưa mã hóa Unicode cho tiếng Việt vào phiên bản 2000. WinVNkey là chương trình máy tính đầu tiên cho phép người dùng gõ tiếng Việt trên Windows 3.0 – phiên bản đầu tiên của hệ điều hành Windows sau MS-DOS. TriChlor – một nhóm phi lợi nhuận ủng hộ việc lấy VISCII làm tiêu chuẩn sử dụng thống nhất, đã thiết kế và cung cấp WinVNKey miễn phí cho người dùng. Vào năm 2000, khi nhận ra tiềm năng phát triển của Unicode, WinVNkey bắt đầu hỗ trợ tiêu chuẩn mã hoá này. Về sau Ngô Đình Học, khi ấy đang làm việc với Unicode và thiết kế trình điều khiển bàn phím tiếng Việt cho Macintosh, đã tiếp quản dự án này. Chương trình này trở thành một phần mềm cho phép nhập liệu đa ngữ là kênh dẫn cho hơn 30 ngôn ngữ quốc tế cũng từng gặp phải khúc mắc khi đưa vào máy tính. Chương trình cũng hỗ trợ ký tự chữ Nôm và ngôn ngữ dân tộc thiểu số Việt Nam.

Ngang tài ngang sức với WinVNKey phải kể đến hệ thống Vietkey khá phổ biến. Vietkey được phát triển vào năm 1991 và phát hành vào năm 1997 bởi Vietkey Group, một công ty có trụ sở tại Việt Nam thành lập bởi Đặng Minh Tuấn – một kỹ sư trẻ của Bộ Quốc phòng thời đó. Ban đầu, Vietkey là một phần mềm miễn phí rồi sau đó được thương mại hoá cùng với các sản phẩm khác của công ty. Vietkey hỗ trợ tiếng Việt, tiếng Anh, tiếng Pháp, tiếng Đức và tiếng Nga và thậm chí còn có cả một phiên bản tương thích với hệ điều hành Linux. Cũng giống với đội ngũ đằng sau WinVNKey, Đặng Minh Tuấn ủng hộ việc tạo dựng một tiêu chuẩn mã hóa ký tự phổ cập để gõ tiếng Việt. Vào năm 1997, Đặng Minh Tuấn và Vietkey đề xuất hỗ trợ Unicode, đến năm 2000, họ đã điều chỉnh phần mềm này sao cho chỉn chu hơn. Tuy nhiên, Vietkey vẫn có một yếu điểm đối với nhiều người: phần mềm này có thu phí.

Phạm Kim Long, lúc bấy giờ vẫn còn là một sinh viên cao học tại Prague, nhận thấy nhu cầu cho một phần mềm khác có thể truy cập rộng rãi và có thể hỗ trợ Unicode ngoài Vietkey. Ông Long đã có ý tưởng phát triển phần mềm phương thức nhập liệu của riêng mình, và đã cho phát hành Unikey vào năm 2000. Bản rút gọn miễn phí của phần mềm này hiện có mặt trên khắp các máy tính ở Việt Nam. Ấp ủ ý tưởng này từ năm 1991 khi ông và các bạn cùng lớp tại Đại học Khoa học và Công nghệ Hà Nội thách đố nhau viết một chương trình đánh máy tiếng Việt nhẹ nhất bằng ngôn ngữ Assembly. Ông Long đã chiến thắng với một chương trình chỉ nặng 2 kilobyte được gọi là LittleVNKey. Tuy nhiên, LittleVNKey không hỗ trợ Unicode. Năm 2000, ông bắt tay thiết kế một chương trình nhập tiếng Việt với hỗ trợ Unicode, sau khi xem các thảo luận trực tuyến về việc Windows 2000 có thể hỗ trợ nhiều ngôn ngữ trong đó có tiếng Việt. Ông đã dành hai ngày để lập trình và phát hành trực tuyến phiên bản đầu tiên của Unikey. Sau đó, ông đã dành bốn tháng tiếp theo để nhận phản hồi và tinh chỉnh phần mềm của mình. Năm 2006, thông qua một người bạn Việt Kiều, Phạm Kim Long đã đồng ý để Apple quyền tích hợp phần mềm trong hệ điều hành của mình. Unikey vẫn là một phần mềm miễn phí và còn đang hiện hành.

Mặc dù ông Long và ông Tuấn là hai người được biết đến nhiều nhất trong hành trình cho tiếng Việt tương thích với máy tính hiện đại, sự phát triển của công nghệ đánh máy đa dạng hơn nhiều và phản ánh nhu cầu văn hóa xã hội và lịch sử của một nhóm dân số khao khát kết nối với thế giới và với chính cộng đồng của họ.

Bài viết liên quan

- Công Nghệ

Gõ tiếng Việt, Phần 1: Cuộc tương ngộ giữa Ngôn ngữ, Danh tính và Công nghệ

Những trải nghiệm đầu tiên của tôi với máy tính bắt đầu trong lớp tin học hàng tuần khi còn ở cấp tiểu học.

- Công Nghệ

5 sáng chế made-in-Vietnam hỗ trợ 'điện-đường-trường-trạm' phòng, chống COVID-19

Giữa giai đoạn phòng chống dịch COVID-19 căng thẳng nhất, hàng loạt các sáng tạo công nghệ made-in-Vietnam đã được ra mắt, không chỉ hỗ trợ hiệu quả các nhân viên tuyến đầu chống dịch, mà còn giú...

- Công Nghệ

App 'chỉ mặt đặt tên' những thiết bị ngốn điện trong nhà

Trong những đợt nắng nóng dai dẳng vừa qua, Việt Nam thường rơi vào trường hợp thiếu hụt điện năng do tình trạng cung không đủ cầu. Nhiều người dân đã chủ động cắt giảm các thiết bị trong nhà để tránh...

- Công Nghệ

Bà Triệu và nền văn minh Việt Nam lần đầu xuất hiện trong game chiến thuật đình đám Civilization

Đây chính là khoảnh khắc mà các fan Việt của tựa game Civilization mong ngóng bấy lâu. 

- Văn Hóa Ẩm Thực

Chuyện ẩm thực: Cô gái hoá thành trái thơm

Lớn lên ở Việt Nam, dường như mọi thứ – từ đồ vật gia đình thông thường đến cây trái, đều có sự tích đặc biệt. Một số những câu chuyện dân gian này khá lãng mạn, nhưng một số khác như sự tích trái thơ...

- Giáo Dục

Chuẩn bị hành trang cho 'biển lớn' đại học tại môi trường quốc tế

“Em thấy mình ngày một trưởng thành hơn”, Yến Nhi, còn có tên tiếng Anh là Milly - một cựu học sinh vừa tốt nghiệp Trường Quốc tế Úc (AIS) vào cuối năm ngoái - kể về hành trình sau khi ra trường với m...