1.5.2 Mã ASCII

Máy tính lưu trữ các ký tự như là con số. Mỗi ký tự được sử dụng bởi các máy tính tương ứng với một số duy nhất, và ngược lại. Nhiều ký tự trong số đó con người không thể nhìn thấy nhưng lại rất cần thiết cho máy tính. Một số ký tự được gọi là “khoảng trắng” (white spaces), một số khác được đặt tên là “ký tự điều khiển” (control characters) vì mục đích của nó là để điều khiển các thiết bị đầu vào/đầu ra.

Một ví dụ về “khoảng trắng” hoàn toàn vô hình với mắt thường là một mã đặc biệt, hoặc một cặp mã (hệ điều hành khác nhau có thể xử lý vấn đề này một cách khác nhau), được sử dụng để đánh dấu kết thúc dòng bên trong tập tin văn bản. Con người không nhìn thấy những dấu hiệu này, nhưng họ có thể thấy tác dụng của ứng dụng của họ nơi những dòng chữ được tách ra.

Để thống nhất giữa tất cả các máy tính trên thế giới thì người ta sinh ra một tiêu chuẩn chung về bảng mã ký tự được chấp nhận rộng rãi bởi hầu hết các máy tính và hệ điều hành trên toàn thế giới. Đó là mã ASCII

ASCII (viết tắt của American Standard Code for Information Interchange) là bảng mã được sử dụng rộng rãi nhất và gần như tất cả các thiết bị hiện hiện đại (máy vi tính, máy in, điện thoại di động, máy tính bảng…) đều sử dụng nó. Bảng mã này cho phép biểu diễn đến 256 ký tự khác nhau, tuy nhiên chúng ta chỉ cần quan tâm đến 128 ký tự đầu tiên.

Nếu bạn muốn biết các ký tự mã hóa như nào thì hãy xem bảng mã ASCII ở link sau: https://en.wikipedia.org/wiki/ASCII

Hãy xem kỹ bảng mã nhé, vì có một số thứ hay ho ở đấy. Nếu bạn để ý thì sẽ thấy một điểm khá đặc biệt. Một trong những ký tự phổ biến nhất đó là dấu cách (mã code 32). Kí tự “a” – mã code 97 và ký tự “A” – mã code 65. Bây giờ chúng ta lấy mã code của “a” trừ đi “A”, kết quả là 32. Vâng, đó chính là mã code của dấu cách. Chúng ta sẽ sử dụng tính năng hay ho này của bảng mã ASCII sớm thôi.Chú ý là các ký tự được sắp xếp trong bảng mã theo thứ tự alphabet trong bảng chữ Latin.

Ngoài ra, mã ASCII đang được thay thế (hoặc được mở rộng) bởi một tiêu chuẩn quốc tế mới có tên UNICODE. Rất may là  bộ mã ASCII cũng là một tập hợp con của UNICODE. UNICODE có thể biểu diễn hầu hết các ký tự được sử dụng trên khắp thế giới. Chúng ta sẽ dành nhiều thời gian hơn để nói về bảng mã UNICODE sau.