Urbanist Vietnam

BackĐời Sống » Công Nghệ » Gõ tiếng Việt, Phần 1: Cuộc tương ngộ giữa Ngôn ngữ, Danh tính và Công nghệ

Gõ tiếng Việt, Phần 1: Cuộc tương ngộ giữa Ngôn ngữ, Danh tính và Công nghệ

Những trải nghiệm đầu tiên của tôi với máy tính bắt đầu trong lớp tin học hàng tuần khi còn ở cấp tiểu học.

Mỗi khi có lớp, chúng tôi thường phải di chuyển từ phòng học thông thường sang phòng máy có máy lạnh. Với đám học trò chúng tôi thì tin học là lớp được đón chờ nhất trong tuần bởi chỉ lúc đó chúng tôi mới được mày mò sử dụng máy tính – một xa xỉ phẩm mà không phải ở nhà ai cũng có, trong bầu khí mát rượi duy trì bởi máy lạnh.

Ở lớp tin học vỡ lòng, chúng tôi bắt đầu làm quen với việc sử dụng con chuột và kỹ năng đánh máy. Điều khiển chuột thì không có gì khó, nhưng đánh máy lại phức tạp hơn nhiều. Năm học đầu, chúng tôi tập cách gõ bằng mười ngón tay và thường chơi các trò đánh máy để nhanh “lên tay”. Khi chúng tôi chuẩn bị lên cấp hai cũng chính là lúc nhà trường bắt đầu hướng dẫn học sinh gõ chữ tiếng Việt.

Dù có nguồn gốc từ bảng chữ cái La-tinh, bảng chữ cái tiếng Việt có thêm bảy ký tự nhờ có các dấu phụ (Â, Ă, Đ, Ê, Ô, Ơ, Ư) và năm dấu âm bao gồm dấu sắc (á, ó, í), huyền (à, ò, ù), hỏi (ả, ỏ, ỉ), ngã (ã, ẽ, ĩ), và nặng (ụ, ọ, ị) xâu chuỗi lại với nhau. Ngay từ khi bắt đầu sử dụng, tôi và những người bạn cấp hai của mình đều thấy ngay rằng sự đơn giản của bàn phím QWERTY không tài nào thể hiện được bản quán cũng như sự phức tạp của tiếng mình.

Chữ Quốc Ngữ

Hệ thống chữ viết của Việt Nam trải qua khá nhiều lần thay da đổi thịt: từ hệ thống chữ viết tượng hình – tiêu biểu là chữ Hán và chữ Nôm; đến hệ thống chữ viết dựa trên bảng chữ cái La-tinh và có thêm dấu phụ. Đây chính là hệ chữ Quốc ngữ mà đến nay người Kinh ở Việt Nam vẫn sử dụng. Chữ Quốc ngữ – theo chân các tu sĩ Bồ Đào Nha vào Việt Nam như một công cụ phục vụ cho sứ mệnh truyền bá tôn giáo hồi thế kỷ XVII, chính là phiên bản đã La-tinh hoá của những nói năng Việt ngữ.

Mặc dù mục đích sử dụng chữ Quốc ngữ ban đầu là vậy, trong thời Pháp thuộc, nhiều học giả nước Nam nhìn thấy khả thể của chữ Quốc ngữ trong việc giải phóng đất nước khỏi hệ tư tưởng phong kiến, ​để đưa nước nhà đến với chủ nghĩa hiện đại. Tầm nhìn này vấp phải sự phản đối đến từ các Nho sĩ và những người theo chủ nghĩa dân tộc bảo thủ bởi họ không ủng hộ văn hoá Pháp và những ảnh hưởng ngoại lai. Dù vậy, đầu thế kỷ thứ XIX chứng kiến cuộc nổi dậy của tầng lớp trí thức với các phong trào chống thực dân như phong trào Duy Tân, phong trào Đông Du và Đông Kinh Nghĩa Thục với mục tiêu thúc giục việc học và sử dụng chữ Quốc ngữ như một ngôn ngữ chính thống của Việt Nam.

Ngày 6 tháng tư năm 1878, Nghị Định 81 đã chính thức công nhận chữ Quốc ngữ ở Việt Nam.

Chữ Quốc ngữ có một số phận khá lạ khi nhận được sự công nhận của cả người Pháp lẫn một bộ phận người Việt ở phe phản đối chế độ thực dân. Với người Pháp, bởi chữ Quốc ngữ có nguồn gốc La-tinh nên nghiễm nhiên nó được dung nạp, góp phần thực hiện tham vọng đồng hoá của thực dân, và là một lựa chọn tiện lợi giữa chữ Hán và tiếng Pháp. Với các phong trào và các học giả chống thực dân, bởi chữ Quốc ngữ thể hiện được âm điệu trúc trắc của tiếng Việt, thế nên nó vừa là hiện thân của một bản quán dân tộc và con đường tiến tới chủ nghĩa Hiện đại. Nằm ở ngã ba đường giữa gọng kìm của hai đế quốc – Trung Quốc và Pháp, chữ Quốc ngữ chính là chọn lựa khả dĩ cho một đất nước đang loay hoay tìm lại căn tính cho mình.

Địa phương hóa các công nghệ đến từ đế quốc: Sự ra đời của Telex

Một hệ lụy của việc người Pháp bóc lột kinh tế, giành quyền kiểm soát có hệ thống và độc quyền các dịch vụ, hàng hóa công ở Việt Nam thể hiện qua sự xuất hiện của một loạt các công nghệ mới. Máy đánh chữ là một ví dụ điển hình cho sự du nhập của công nghệ thường nhật vào nước ta. Dù không rõ chiếc máy đánh chữ xuất hiện lần đầu vào năm nào, nhưng nếu dựa vào tham chiếu qua một vài mẩu tin quảng cáo trên báo thì máy đánh chữ có mặt ở Việt Nam từ năm 1929.

Những máy đánh chữ đầu tiên ở Việt Nam tuân theo hệ thống lấy trọng tâm là tiếng Pháp là bàn phím AZERTY mặc dù bàn phím QWERTY là cách dàn trải chữ cái phổ biến nhất ở phương Tây lúc bấy giờ.

Cách bố trí bàn phím AZERTY (trên) và Hermes Baby (dưới). Ảnh chụp màn hình bản số hoá của cuốn Larousse mensuel Illustré (trên). Ảnh của Retro Tech Geneva (dưới).

Trong cuốn Cycles of Empowerment? The Bicycle and Everyday Technology in Colonial India and Vietnam và cuốn Everyday Technology in South and Southeast Asia: An Introduction, David Arnold và Erich DeWald lập luận rằng ta nên xem xét những phát kiến về công nghệ của thực dân đã thay đổi nhận thức của người bản địa thay vì chỉ cắt nghĩa hành động này như một sự truyền bá một chiều từ phương Tây. Cán cân khi nghiêng về quan điểm rằng công nghệ chính là một khái niệm trọng châu Âu đã tri nhận quyền được thương lượng của người dân bản địa trước sự kiểm soát của chế độ thực dân. Và hệ thống đã qua điều chỉnh AĐERTY thể hiện rõ diễn ngôn này.

Từ lúc nào và làm thế nào mà những cách bố trí bàn phím nhất định xuất hiện là một câu hỏi không lời giải đáp. Theo David Arnold và Erich DeWald, bàn phím Quốc ngữ đã có từ cuối những năm 1920 đến đầu những năm 1930. Năm 1960, Daniel Loren Carmichael từ Nhóm Tư vấn về Việt Nam của Đại học Bang Michigan trình bày một đề án có chỉ ra rằng bàn phím này xuất hiện vào năm 1947. Nhà báo và dịch giả Nguyễn Văn Vĩnh trong một bài báo lại dẫn chứng việc các hãng máy đánh chữ như Underwood và Royal đã bắt đầu thay đổi cách bố trí bàn phím truyền thống cho phù hợp hơn với chữ Quốc ngữ từ năm 1922. Máy đánh chữ tiếng Việt tồn tại xuyên suốt chiến tranh chống Mỹ – khi nó được sử dụng trong mặt trận giải phóng dân tộc miền Nam, và cho đến cuối những năm 1980 – khi nghề đánh máy vẫn còn là một sinh kế khả thi trong các tòa soạn và văn phòng.

Máy đánh chữ Olympia Splendid 33 với bố cục AĐERTY đi vào sử dụng trong những năm 1960 và hiện đang được trưng bày tại Bảo tàng Hồ Chí Minh. Ảnh của WikiCommons.

Máy đánh chữ không hẳn là ví dụ độc nhất về việc công nghệ phương Tây được dùng sao cho tương thích với bối cảnh nước ta. Nhiều công nghệ in như công nghệ linoletterpress đã được điều chỉnh để có thể in chữ Quốc ngữ. Xưởng đúc chữ Deberney & Peignot của Pháp đã tạo ra 127 kiểu chữ cho chữ Quốc ngữ. Vào năm 1930, công ty này đã lưu lại và in ra một số kiểu trong quyển số ba thuộc vựng tập các kiểu chữCaractères Étrangers (tạm dịch: Các ký tự Nước ngoài).

Ảnh chụp màn hình từ Caractères ètrangers.

Việc tương thích công nghệ đánh máy đóng vai trò quan trọng trong khía cạnh hậu cần. Đầu những năm 1860, người Pháp đã xây dựng mạng lưới điện báo khắp Việt Nam và Đông Dương thiết lập nên một kết nối liên lạc liền mạch giữa các cơ quan thuộc địa. Bưu điện đầu tiên được người Pháp xây dựng vào năm 1862 tại Sài Gòn. Trong cuốn hồi ký L'Indochine Francaise, cựu toàn quyền Đông Dương Paul Doumer tuyên bố rằng mạng lưới điện báo của Pháp đã bao phủ 18.000 km vùng Đông Dương tính đến cuối năm 1901. Người Việt ở Đông Dương lúc bấy giờ gọi các khu điện báo của Pháp là “nhà dây thép” ám chỉ phương pháp truyền tin bằng cách sử dụng dây với ống dẫn bằng thép. Hồi này, người ta thường dùng từ “đánh dây thép” để chỉ hành động gửi đi một bức điện tín.

Ban đầu, những người sử dụng điện báo chỉ có các sĩ quan và giới thượng lưu Pháp. Tuy nhiên, khi số lượng nhân viên người Việt tại các bưu điện Pháp tăng lêndịch vụ điện báo ngày càng rẻ hơn, thì nhu cầu giao tiếp bằng chữ Quốc ngữ thông qua mã Morse – một ngôn ngữ điện báo phổ biến lúc bấy giờ, bắt đầu xuất hiện. Người Việt Nam khi đó sử dụng một hệ thống có tên là Telex – là một bộ quy tắc có khả năng thể hiện dấu phụ của tiếng Việt mà mã Morse không hỗ trợ. Ông Nguyễn Văn Vĩnh chính là người khai sinh ra hệ thống Telex.

Ông Vĩnh là một trong những người ủng hộ chữ Quốc ngữ nhiệt tình nhất. Ông theo chủ nghĩa dân tộc và phản Nho giáo tân tiến với niềm tin tương lai Việt Nam phụ thuộc vào hệ chữ này. Một số chuyện kể rằng sau khi thấy một người Việt nhận điện báo từ Nam Định với nội dung chỉ vỏn vẹn có “vo de" bởi lẽ từ này có thể đọc là “vỡ đê,” hay “vợ đẻ,” ông Vĩnh đã đưa ra một bộ quy tắc bỏ dấu khi sử dụng bàn phím tiếng Pháp.

Năm 1929, ông đề xuất ý tưởng này của mình trong một bài viết của Trung Bắc Tân Văn, tờ báo nơi ông làm biên tập viên. Ý chính trong lập luận của ông tập trung vào giá trị của việc nhường chỗ của các dấu phụ cho những ký tự không tồn tại trong tiếng Việt, hoặc thường sẽ chẳng bao giờ được nối ghép vào nhau. Ông Vinh còn thể hiện tâm huyết của mình khi đề xuất rằng trong viết chữ truyền thống, các ký tự chữ cái này nên thay thế hoàn toàn dấu phụ và âm điệu để tạo ra một ngôn ngữ phù hợp hơn với các tiêu chuẩn viễn thông phương Tây. Tuy nhiên, ý tưởng của ông bị chối từ vì nhiều người muốn lưu giữ các dấu âm của Việt Nam.

Một bài viết trên Khoa Học Tạp Chí về việc thay đổi chữ quốc ngữ. Ảnh chụp màn hình qua Thư viện Quốc gia Việt Nam.

Nguyễn Văn Vĩnh không phải là người đầu tiên nghĩ đến việc thay thế các âm điệu tiếng Việt bằng các chữ cái. Theo một bài báo trên Khoa Học Tạp Chí vào năm 1933 thì vào năm 1919, một học giả tên Phó Đức Thành đã viết một bài báo trên Trung Bắc Tân Văn đề xuất rằng có thể dùng các ký tự B, D, K, L, Q để thể hiện các dấu âm. Một phản hồi đăng cùng trang lại cho rằng việc sử dụng năm chữ cái B, D, K, L, Q chỉ hợp lý trong một số trường hợp nhất định chứ không thể áp dụng như một quy tắc chung dùng cho mọi lúc. Phản hồi cũng nêu ra rằng tổng biên tập của tờ báo này chính là ông F. H. Schneider trước đó từng đề xuất một hệ thống tương tự.

Về sau những nỗ lực phát minh ra một hệ quy tắc giao tiếp tiếng Việt qua mã Morse như trên được điều chỉnh cho tương thích với bàn phím tiếng Anh và tiếng Pháp. Như vậy, chính ngành bưu chính đã định hình quy tắc Telex mà nhiều người trong chúng ta ngày nay vẫn sử dụng để gõ tiếng Việt trên máy tính. Hệ thống Telex hiện tại được diễn giải như dưới đây:

Ảnh chụp màn hình thông qua bài viết Telex của Wikipedia.

Điện toán hoá Chiến tranh

Sự phát triển ban đầu của khoa học điện toán và công nghệ thông tin ở Việt Nam xảy ra khi đất nước vừa bị chia cắt bởi Hội nghị Genève vào năm 1954. Trong khi miền Bắc đang xây dựng một chế độ xã hội chủ nghĩa với sự giúp đỡ từ các nước Liên Xô, miền nam được Pháp và Hoa Kỳ hậu thuẫn. Sự phân vùng này rẽ ra hai quỹ đạo khác nhau cho số phận của những chiếc máy tính đầu tiên ở Việt Nam trong những năm 1960 và 1970: một chịu ảnh hưởng bởi truyền thống điện toán trong khối Xô Viết, và một chịu ảnh hưởng từ Mỹ.

Dòng máy tính đầu tiên xuất hiện ở miền bắc Việt Nam vào năm 1968 là Minsk-22, được sản xuất bởi vào năm 1965 bởi Byelorussian SSR – một đơn vị thuộc liên bang Xô Viết mà hiện nay là vùng thuộc Belarus, Litva, Ba Lan và Nga. Minsk-22 là một mô hình của gia đình máy tính vĩ mô Minsk nổi tiếng dùng trong việc lập kế hoạch và tính toán kinh tế. Giống với hầu hết các máy tính đời đầu ở thời điểm đó, dòng máy Minsk chủ yếu được sử dụng cho mục đích nghiên cứu và tính toán. Các kỹ sư hệ thống người Việt trong thời gian này đã phải học cách vận hành dòng Minsk-22 và về sau là các đời như Minsk-32 hoặc ODRA 1304 do Ba Lan sản xuất và dùng tiếng Nga.

Một phân đoạn trong phim Con Chim Biết Chọn Hạt (năm 1979) chiếu cảnh một nhà khoa học đang vận hành một máy chủ do khối Liên Xô sản xuất.

Ở miền nam Việt Nam, đối với quân đội Hoa Kỳ vai trò của máy tính và kỹ năng tin học đóng một vai trò trọng yếu bởi đây chính là những công cụ để điện toán hóa chiến tranh, giúp thu thập, xử lý dữ liệu liên quan đến quân đội miền Bắc Việt Nam. Trong bài báo Máy tính, dữ liệu điện tử và chiến tranh Việt Nam, nhà sử học Donald Fisher Harrison lập luận rằng chiến tranh Việt Nam là cuộc chiến đầu tiên trong lịch sử sử dụng hoàn toàn dữ liệu điện tử. Quân đội Hoa Kỳ đã cho xây dựng nhiều trung tâm và trạm máy tính trên khắp Việt Nam để phục vụ cho việc xử lý dữ liệu liên quan đến chiến trận. Trong cuốn After Pinkville, Noam Chomsky mô tả mục đích của quân Mỹ trong chiến tranh Việt Nam là để "biến đất Việt Nam thành một cỗ máy giết người tự động.”

Dự án điện toán hóa của quân đội Mỹ được hỗ trợ bởi International Business Machines Corporation (IBM), một nhà sản xuất máy tính tiên tiến hàng đầu Hoa Kỳ lúc bấy giờ. Một số máy chủ và máy nhỏ tân thời của thương hiệu này du nhập vào miền Nam Việt Nam phải kể đến dòng IBM 1400 và nhiều mô hình khác nhau thuộc loạt IBM System/360.

Một bài báo đăng trên tờ The Misc vào năm 1970 về sự dây dướng của IMB trong chiến tranh Việt Nam (trái) và một bức ảnh ghi lại việc bà Nguyễn Thị Nhìn lấy thông tin từ ngân hàng bộ nhớ của máy tính (phải). Hình ảnh của Vassar Archive (trái). Ảnh của Douglas Pike từ Vietnam Center and Archive (phải).

Một bài báo của New York Times ngày 1 tháng Mười năm 1969 đã miêu tả Trung tâm Tình báo Kết hợp ở Sài Gòn (nơi đặt hầu hết các máy chủ của IBM) là một cơ quan khá phức tạp: “Từ sáng đến đêm trong bầu khí quyển vô khuẩn có một bầy máy tính vo vo âm ỉ ngấu nghiến, tiêu hoá, rồi nhổ toẹt ra một khối thông tin khổng lồ về kẻ thù."

Lượng dữ liệu mà quân đội Mỹ thu thập về đối thủ làm người ta kinh hãi, như tờ Times có nêu: "Quang cảnh nước Việt Nam và các khu vực biên giới ngập ngụa trong những cảm biến điện tử luôn chực chờ truyền tin về ngân hàng máy tính. Radar, máy ảnh, máy dò hồng ngoại và một loạt các thiết bị ngày càng lạ lẫm khác cũng đóng góp nhiều cho việc tập hợp các dữ liệu. Cách đây không lâu, các máy bay trinh sát đã bắt đầu mang theo máy quay truyền hình."

Thời kỳ nhiễu nhương này hình thành nên một trong những cố gắng đầu tiên làm cho tiếng Việt tương thích hơn với các máy tính đời đầu. Trong cuốn sách White Shirts and Ties và cuốn White Shirts and Ties, Dan Feltham, một chuyên gia của IBM từng làm việc tại Sài Gòn, hồi tưởng lại quãng thời gian từ năm 1965 đến năm 1973 đã có 250 chuyên gia máy tính của IBM làm việc trong thành phố. Công việc của các chuyên gia này bao gồm viết các phần mềm ứng dụng, xây dựng trung tâm máy tính và đào tạo kỹ năng xử lý dữ liệu và lập trình cho các chuyên gia Việt Nam. Một số ngôn ngữ máy tính được dạy bao gồm FORTRAN, COBOL và PL/1.

Một nhóm các nhà vận hành thẻ bấm lỗ (keypunch) của Việt Nam, hầu hết đều là những sinh viên ưu tú. Ảnh của Douglas Pike qua Vietnam Center.

Vào ngày 26 tháng 3 năm 1970, Cơ quan Phát triển Quốc tế Hoa Kỳ (USAID) thông qua một dự án in ấn trong tiếng Việt. Do những dòng máy đầu không hỗ trợ dấu phụ của tiếng Việt, nhiều kỹ thuật viên của dự án đã phải in tiếng Việt không dấu sử dụng máy tính được trang bị máy in và bàn phím IBM 1403, rồi sau đó đắp dấu lên chữ bằng tay. Tuy nhiên, các kỹ sư hệ thống của IBM đã tìm ra một giải pháp cho phép nhập tài liệu tiếng Việt có dấu ngay từ chính chiếc máy này. Giải pháp này có tên gọi là chuỗi in tiếng Việt 1403.

Làm việc với chuỗi in 1403. Ảnh chụp màn hình từ When Big Blue Went To War.

Người vận hành keypunch Trần Thị Minh Hương chuyển dữ liệu vào thẻ đục lỗ. Ảnh của Douglas Pike.

Chuỗi in 1403 đòi hỏi một chương trình và một loại đạn bằng kim loại đặc thù cho dịch thuật. Các kỹ sư mã hóa tiếng Anh sang tiếng Việt có thêm các dấu phụ rồi bấm những dữ liệu này vào thẻ đục lỗ. Các chữ cái có dấu phụ sẽ cần đến hai khoảng trắng – biểu thị hai byte trên thẻ đục lỗ, trong khi ký tự tiếng Anh không dấu chỉ cần một khoảng. Bởi thế, máy tính sẽ đọc một chữ cái thành hai ký tự. Nhằm chỉnh đốn quy trình này, Hội đồng đã viết một chương trình hướng dẫn máy tính đọc chữ có dấu như là một ký tự. Sau đó, họ cho sản xuất một loại đạn dành riêng cho việc in ấn tiếng Việt có dấu.

Bài viết liên quan

- Công Nghệ

Gõ tiếng Việt, Phần 2: Người Việt xa xứ, Unicode và Sự phổ biến của Unikey

Đây là phần 2 của bộ bài viết về lịch sử công nghệ gõ chữ tiếng Việt. Độc giả có thể đọc phần 1 tại đây.

- Văn Hóa Ẩm Thực

Chuyện ẩm thực: Cô gái hoá thành trái thơm

Lớn lên ở Việt Nam, dường như mọi thứ – từ đồ vật gia đình thông thường đến cây trái, đều có nguồn gốc đặc biệt. Một số những câu chuyện dân gian này khá lãng mạn, nhưng một số khác như sự tích trái t...

- Giáo Dục

Chuẩn bị hành trang cho 'biển lớn' đại học tại môi trường quốc tế

“Em thấy mình ngày một trưởng thành hơn”, Yến Nhi, còn có tên tiếng Anh là Milly - một cựu học sinh vừa tốt nghiệp Trường Quốc tế Úc (AIS) vào cuối năm ngoái - kể về hành trình sau khi ra trường với m...

- Môi Trường

Có gì trong khoá học bảo tồn động vật hoang dã Việt Nam tương lai?

Tại Vinh, có một khóa học nhằm mục đích mang đến cho các sinh viên Việt Nam cơ hội thay đổi cách người Việt thường đối xử với động vật.

- Môi Trường

Ghé thăm một lò tái chế bìa các-tông và nhôm ở Sài Gòn

Khi truyền thông quốc tế và cả trong nước vẫn đang tập trung bàn tán về vấn đề ô nhiễm rác thải từ nhựa, cỏ vẻ như người ta vẫn chưa để tâm nhiều tới rác thải có thành phần là các vật liệu khác ví dụ ...

- Ăn

Hẻm Gems: Cuộc sống của một gia đình dưới chân núi Langbiang

Thị trấn Lạc Dương không phải là nơi mà ta có thể dễ dàng tìm thấy những tiện nghi thường thấy ở thành phố, dù chỉ cách trung tâm Đà Lạt 12km.